详细内容
IE里的探索之定制浏览器好助手(下)
访问文档对象 现在 BHO 引用了 Internet Explorer 的 WebBrowser 控件并已经连接到浏览器 以接收它产生的事件。在 Web 页面被完全下载并被正确地初始化之后,现在终于可以通过 DHTML 文档对象模型访问它了。WebBrowser 的 Document 属性返回一个指向文档对象的 IDispatch 接口的指针: CComPtr<IDispatch> pDisp; HRESULT hr = m_spWebBrowser2->get_Document(&pDisp); get_Document() 方法提供的只是一个指向接口的指针。我们需要确定在 IDispatch 指针后面确实是一个 HTML 文档对象。如果使用 Visual Basic,以下是等价的代码: Dim doc As Object Set doc = WebBrowser1.Document If TypeName(doc)="HTMLDocument" Then ' Get the document content and display Else ' Disable the display dialog End If 现在我们需要判断 get_Document() 返回的 IDispatch 指针的实质。Internet Explorer 不仅是一个 HTML 浏览器,还能处理任何 ActiveX 文档 ;即任何有作为 ActiveX 文档服务程序的应用程序支持的文档。这样一来,就不能保证查看的文档的确是一个 HTML 页面。 有一个解决办法就是查看 URL 并检查 URL 的扩展名。但该如何处理 Active Server Pages (ASP) 或一个暗含指向 HTML 页面的 URL?如果你使用了像 about 或 res 这样的定制协议又该如何? 我们决定采取另一种方式,它和上面的 Visual Basic 代码性质相同。这种想法就是,如果 IDispatch 指针确实指向一个 HTML 文档,对 IHTMLDocument2 接口的访问就能成功地返回。IHTMLDocument2 是综合了 DHTML 对象模型为 HTML 页面实现的所用功能的接口。以下代码片断说明如何进行这样的判断: CComPtr<IDispatch> pDisp; HRESULT hr = m_spWebBrowser2->get_Document(&pDisp); CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> spHTML; spHTML = pDisp; if (spHTML) { // 取得文档的内容并显示它 } else { // 禁止代码窗口控件 } 如果访问 IHTMLDocument2 接口失败,spHTML 指针为 NULL。否则,我们就可以正常访问 DHTML 对象模型的方法和属性了。 现在的问题是如何获得已显示的页面的源代码。幸好,基本的 DHTML 知识就足以做到这一点。由于 HTML 页面将它所有的内容包含在 <BODY> 标记中,DHTML 对象模型要求你首先获得指向 Body 对象的指针: CComPtr<IHTMLElement> m_pBody; hr = spHTML->get_body(&m_pBody); 奇特的是,DHTML 对象模型不让你知道在 <BODY> 之前的标记,例如 <HEAD> 的原始内容。这些内容已经被处理并被保存到一系列属性中了,但你依然不能得到一个最初的 HTML 文件的原始内容。然而,现在 body 能告诉我们的就足够了。我们需要将 outerHTML 属性的内容读取到一个 BSTR 变量里以获得包含在 <BODY> 和 </BODY> 之间的 HTML 代码。 BSTR bstrHTMLText; hr = m_pBody->get_outerHTML(&bstrHTMLText); 现在,在代码窗口中显示文本的工作就是创建窗口、将字符串从 Unicode 转换为 ANSI,并如图 3 中所示设置编辑框。以下是完成这些工作的全部代码: HRESULT CViewSource::GetDocumentContent() { USES_CONVERSION; // 获得 WebBrowser 文档对象 CComPtr<IDispatch> pDisp; HRESULT hr = m_spWebBrowser2->get_Document(&pDisp); if (FAILED(hr)) return hr; // 验证我们得到了一个指向 IHTMLDocument2 接口的指针 // 我们查询 IHTMLDocument2 接口 (通过灵巧指针) CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2> spHTML; spHTML = pDisp; // 获得文档的源代码 if (spHTML) { // 获得 BODY 对象 hr = spHTML->get_body(&m_pBody); if (FAILED(hr)) return hr; // 获得 HTML 文本 BSTR bstrHTMLText; hr = m_pBody->get_outerHTML(&bstrHTMLText); if (FAILED(hr)) return hr; // 将文本从 Unicode 转换为 ANSI LPTSTR psz = new TCHAR[SysStringLen(bstrHTMLText)]; lstrcpy(psz, OLE2T(bstrHTMLText)); // 允许修改文本 HWND hwnd = m_dlgCode.GetDlgItem(IDC_TEXT); EnableWindow(hwnd, true); hwnd = m_dlgCode.GetDlgItem(IDC_APPLY); EnableWindow(hwnd, true); // 设置代码窗口的文本 m_dlgCode.SetDlgItemText(IDC_TEXT, psz); delete [] psz; } else // 文档不是 HTML 页面 { m_dlgCode.SetDlgItemText(IDC_TEXT, ""); HWND hwnd = m_dlgCode.GetDlgItem(IDC_TEXT); EnableWindow(hwnd, false); hwnd = m_dlgCode.GetDlgItem(IDC_APPLY); EnableWindow(hwnd, false); } return S_OK; } 由于我们运行这段代码以响应 DocumentComplete 通知,每个新页面都会迅速地自动处理。DHTML 对象模型允许你修改显现的页面的结构,但在你按 F5 键或浏览器的 Refresh 按钮刷新视图后,所有的修改会立即丢失。通过对 DownloadComplete 事件进行处理你能同时刷新代码窗口。(注意 DownloadComplete 事件比 DocumentComplete 事件先到达) 这时,你应该忽略第一次下载页面时产生的 DownloadComplete 而只考虑刷新时产生的事件。一个简单的布尔成员例如 m_bDocumentCompleted 可以用来区分这两种情况。 管理代码窗口 用以显示当前页面的 HTML 源代码的代码窗口是 ATL 的另一个基本元素,一个可以在 ATL 对象向导的 Miscellaneous 页里找到的对话框窗口。我们重置这个窗口的尺寸以响应 WM_INITDIALOG 消息,并使此窗口占据桌面工作区,即屏幕的可用部分减掉任务栏可能占据位置最下面的部分。 浏览器启动时此窗口可能出现也可能不出现。默认情况下它是出现的,但可以通过清除复选框 Show window at startup 禁止。如果你愿意也可以关掉它。随后,可以在任何时候按 F12 键将其召回。F12 由我们在 SetSite() 中安装的键盘挂钩捕获。 启动设置完全按照 Microsoft 指示保存在注册表里。读写注册表时我们没有使用 Win32 函数,而是使用了新的 Shell Lightweight API (shlwapi.dll),这样 可以避免打开和关闭相应的注册表项的麻烦: DWORD dwType, dwVal; DWORD dwSize = sizeof(DWORD); SHGetValue(HKEY_CURRENT_USER, _T("Software\\MSDN\\BHO"), _T("ShowWindowAtStartup"), &dwType, &dwVal, &dwSize); 这个 DLL 是在 Internet Explorer 4.0 和 Active Desktop 中引入的,从 Windows 98 开始成为标准的系统组件。这些函数比相应的 Win32 函数更直接,适合只进行一次读写时使用。 注册助手对象 BHO 是 COM 服务程序,应该同时以 COM 服务程序和 BHO 注册。ATL 模板为你提供了完成第一项注册的注册脚本代码 (RGS) 。以下是完成 BHO 注册的 RGS 代码。(CLSID 是从例程序中得到的。) HKLM { SOFTWARE { Microsoft { Windows { CurrentVersion { Explorer { 'Browser Helper Objects' { ForceRemove {1E1B2879-88FF-11D2-8D96-D7ACAC95951F} }}}}}}} 注意 ForceRemove 子句使键在对象取消注册时被删除。 在 Browser Helper Objects 键下是所有安装的助手对象。浏览器从不将这些放入缓存,所以安装并测试 BHO 是一个很快的过程。 BHO小结 本文中,我们介绍了浏览器助手对象,一种相对来说比较新的、在浏览器的地址空间内直接引入你的代码的有效方式。你所要做的就是编写一个 COM 服务程序以支持 IObjectWithSite 接口。这里,你的模块从所有预定目的来看都是浏览器机构中的一个组件。本文中我们建立的例程序还涉及到如 COM 事件、动态 HTML 对象模型以及 WebBrowser 编程接口等内容。我们认为它演示了 BHO 的功能,同时提供了一个创建你自己对象的实用平台。如果你需要知道浏览器正在显示什么,你一定需要熟悉事件并进一步了解 WebBrowser。现在你知道:预先警告是为了早做准备。作为结语,我们提醒你 BHO 对 Windows Explorer 非常有用,而且,通过 WebBrowser,它能由你的代码驱动。 |