青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

鳳之焚的博客

靜者,無瀾也.凈者,無貪也.無貪無瀾者,海納百川也!
posts - 2, comments - 5, trackbacks - 0, articles - 0
  C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

網頁源碼過濾

Posted on 2006-08-29 16:43 鳳之焚 閱讀(3962) 評論(2)  編輯 收藏 引用 所屬分類: IE相關

本例通過Mime filter技術對網頁源碼進行過濾,本文部分摘自《HTML代碼過濾技術》

       要實現HTML代碼過濾必需注冊一個或多個MIME過濾器(Pluggable MIME Filter)。MIME過濾器是一個COM對象,必需實現IInternetProtocolSink和IInternetProtocol接口。
       在實現MIME過濾器對象之前,先看一下《Pluggable Protocols Overview》一文中關于MIME過濾器與WEB處理器(transaction handler,即urlmon.dll)之間接口的調用的描述(注:urlmon.dll內部實現了IInternetProtocol和IInternetProtocolSink接口):
 
1、 WEB處理器調用MIME過濾器的IInternetProtocolRoot::Start方法(IInternetProtocol從IInternetProtocolRoot派生);
2、 WEB處理器先后調用MIME過濾器的IInternetProtocolSink::ReportProgress 和IInternetProtocolSink::ReportData方法;
3、        MIME過濾器調用WEB處理器的IInternetProtocol::Read方法;
4、 MIME過濾器調用WEB處理器的IInternetProtocolSink::ReportData方法;
5、 WEB處理器調用MIME過濾器的IInternetProtoco::Read方法;
 
因此,要實現MIME過濾器,有幾個重要的方法:
1、IInternetProtocolRoot::Start方法:
HRESULT Start(
    [in] LPCWSTR szUrl,
    [in] IInternetProtocolSink *pOIProtSink,
    [in] IInternetBindInfo *pOIBindInfo,
    [in] DWORD grfPI,
    [in] DWORD dwReserved
);
作為MIME過濾對象,szUrl傳入的是MIME的類型(如果是name space handlers對象,則該參數為一個即將下載或解析的URL)。若是你想得到URL,可以通過pOIBindInfo 接口得到,下面是示例:
       LPOLESTR pwzUrl ;           
       ULONG uElFetched ;
       pIBindInfo->GetBindString( BINDSTRING_URL , &pwzUrl , 1 , &uElFetched )
pOIProtSink是由urlmon.dll提供的IInternetProtocolSink接口,因為在后面的處理過程中,需要調用到該接口,所以要將它保存;
grfPI是一個枚舉變量,必需包含PI_FILTER_MODE標志,表示該對象運行在filter模式中。
dwReserved是一個指向PROTOCOLFILTERDATA結構的指針,該結構的pProtocol成員是由urlmon.dll提供的IInternetProtocol接口,因為在后面的處理過程中需要調用到該接口,所以要將它保存。實際上該接口也可以通過pOIProtSink參數調用QueryInterface得到,同樣PROTOCOLFILTERDATA結構的pProtocolSink與pOIProtSink都是指向同一個接口。
       在Start方法中,我們必需做的實際上只是保存urlmon.dll提供的IInternetProtocolSink
和IInternetProtocol接口。
 
2、IInternetProtocolSink::ReportProgress方法:
HRESULT ReportProgress(
    [in] ULONG ulStatusCode,
    [in] LPCWSTR szStatusText
作為MIME過濾器,ulStatusCode一般都是BINDSTATUS_CACHEFILENAMEAVAILABLE , 當ulStatusCode為BINDSTATUS_CACHEFILENAMEAVAILABLE時,szStatusText為臨時緩存文件的路徑名稱,但有一些網頁并不寫到緩存里,所以szStatusText可能為空字符串。
 
3、IInternetProtocolSink::ReportData方法:
HRESULT ReportData(
    [in] DWORD grfBSCF,
    [in] ULONG ulProgress,
    [in] ULONG ulProgressMax
);
IE下載文件過程中或下載完畢時會調用MIME過濾器的ReportData方法,ulProgressMax為文件總是數據量,ulProgress為下載進度,理論上當文件全部下載完后,ulProgress應等于ulProgressMax(實際上,當網頁文件不是很大時,即使ulProgress不等于ulProgressMax時,文件也可能全部下載下來),還有一個反應文件下載情況的參數是grfBSCF。有時,ReportData方法會被Web處理器調用多次。
    ReportData是過濾網頁內容或修改網頁內容比較合適的地方。在此地,可以將網頁內容通過調用Read保存到自已的緩存或流中并做適當的處理(注意檢查字符的編碼)。
最后,別忘了調用Web處理器的IInternetProtocolSink::ReportData方法,向它匯報數據下載的情況。Web處理器得到此通知后,就會調用MIME過濾器的IInternetProtocol::Read,此時,你就可以將修改后的數據交給WEB處理器。
    下面的代碼示例了如何在ReportData中調用Web處理器的Read預先保存數據:
                     CString Ts("");
       char p[1024];
       HRESULT hr;
       ULONG Readtotal;
       do
       {
              memset(p,0,sizeof(p));
              hr = UrlMonProtocol->Read(p, sizeof(p)-1, &Readtotal);
              CString pTemp(p);
              Ts=Ts+pTemp;
}while((hr != S_FALSE) && (hr != INET_E_DOWNLOAD_FAILURE) && (hr != INET_E_DATA_NOT_AVAILABLE));
 
Read成功取得數據一般只返回S_OK或S_FALSE ,返回S_OK表示還有數據,而S_FALSE
表示數據已讀取完畢,因此循環(huán)的條件設為 hr==S_OK。那A處的條件判斷為什么不是
if( hr == S_OK || hr == S_FALSE ) 呢, 因為我發(fā)現某些情況下,Read可能返回其
它值,但仍然有成功讀取一部分數據出來,數據的大小就是Readtotal指定的值。如果將
那部分數據遺落,網頁將無法正常解析。
       下列代碼建立臨時文件:
if (CacheFileName == "")
       {
                     TCHAR FName[512];
CreateUrlCacheEntry(OLE2T(Url), Ts.GetLength(), _T("htm"), FName, 0);
                     CFile hFile;
                     hFile.Open(FName, CFile::modeCreate|CFile::modeWrite);
                     hFile.Write(Ts,Ts.GetLength()); 
                     ReportProgress(BINDSTATUS_CACHEFILENAMEAVAILABLE, T2W(FName));
       }
       修改網頁代碼:
Ts.Replace(_T("百度"),_T("千度"));
       為瀏覽器準備好數據:
TotalSize= Ts.GetLength() ;
              CreateStreamOnHGlobal(0, true, &DataStream);
              const char * pTs = Ts.GetBuffer(Ts.GetLength());
              ULONG cbWritten;
              DataStream->Write(pTs,Ts.GetLength(),&cbWritten);
              Ts.ReleaseBuffer();
              pTs = NULL;
 
              ULARGE_INTEGER Dummy;
              _LARGE_INTEGER zero;
              zero.QuadPart =0;
              DataStream->Seek ( zero, STREAM_SEEK_SET, &Dummy);
 
4、IInternetProtocol::Read方法
    該方法由WEB處理器調用來取得瀏覽器要解析的數據。在上一方法ReportData中
我們已經將所有數據緩存到流中,因此,這里只需將流中的數據返回給WEB處理器。
下面的代碼示例了Read中的簡單處理:
                  DataStream->Read(pv, cb, pcbRead);
       Written+=*pcbRead;
       if (Written == TotalSize)
       {
              return S_FALSE;
       }
       else
       {
              return S_OK;
       }
    千萬注意,在數據已讀取完畢時要返回S_FALSE , 不然可能導致Read被無窮循環(huán)調用。處理完這幾個方法后,基本是大功造成,其它一些方法處理十分簡單,可以參考上面提到的例子。 

源代碼下載

Feedback

# re: 網頁源碼過濾  回復  更多評論   

2006-11-22 17:20 by lael
請問怎么知道是iframe還是主框架呢?

# re: 網頁源碼過濾  回復  更多評論   

2014-03-03 15:27 by mrdrag
正好看到這個,不錯的文章

只有注冊用戶登錄后才能發(fā)表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美一级午夜免费电影| 久久精品国产第一区二区三区| 免费亚洲一区二区| 玖玖综合伊人| 日韩视频一区二区三区在线播放免费观看 | 欧美在线资源| 久久国产精品99久久久久久老狼| 国产网站欧美日韩免费精品在线观看| 欧美一级播放| 久久九九热re6这里有精品| 亚洲成人中文| 亚洲精选视频在线| 国产精品素人视频| 毛片一区二区三区| 欧美日本免费| 久久精品国产成人| 女同一区二区| 欧美一区二区三区在线看 | 欧美亚洲色图校园春色| 伊人成年综合电影网| 亚洲人成网在线播放| 欧美日韩视频在线| 久久精品成人一区二区三区| 久久躁日日躁aaaaxxxx| 亚洲自拍偷拍麻豆| 久久综合久久久久88| 亚洲性感激情| 久久中文欧美| 亚洲欧美日韩区| 欧美大片免费久久精品三p | 亚洲国产视频一区| 国产小视频国产精品| 亚洲日本在线观看| 国产一区二区观看| 日韩亚洲视频在线| 亚洲大片在线| 欧美亚洲视频在线观看| 一区二区三区欧美视频| 久久网站免费| 久久九九国产| 国产精品日本欧美一区二区三区| 欧美激情欧美激情在线五月| 国产精品乱码一区二区三区| 亚洲国产精品久久久久久女王| 国产视频观看一区| 在线视频欧美一区| 99riav1国产精品视频| 久久精品国产综合精品| 性欧美暴力猛交另类hd| 欧美日韩一区在线播放| 欧美激情中文字幕乱码免费| 国产综合欧美在线看| 亚洲一区久久久| 在线一区亚洲| 欧美另类高清视频在线| 欧美成年人视频网站| 韩国av一区二区三区| 亚洲欧美日韩国产一区二区三区| 亚洲无人区一区| 欧美日韩成人综合| 亚洲精品免费一二三区| 99这里只有精品| 欧美激情精品久久久久久免费印度 | 亚洲激情欧美| 免费视频亚洲| 亚洲国产毛片完整版| 亚洲国产精品123| 麻豆精品网站| 亚洲黄色av| 一区二区三欧美| 欧美日韩激情网| 亚洲色无码播放| 午夜精品www| 国产一区二区三区日韩欧美| 欧美一区二区成人| 裸体丰满少妇做受久久99精品| 好吊色欧美一区二区三区四区| 久久精品综合| 亚洲国产精品激情在线观看| 日韩特黄影片| 国产精品成人免费| 性欧美暴力猛交另类hd| 久久天堂av综合合色| 亚洲黄色性网站| 欧美日韩成人在线视频| 亚洲一区制服诱惑| 久久一二三国产| 亚洲精品久久久久久一区二区| 欧美日韩黄色一区二区| 亚洲一区视频在线观看视频| 久久综合狠狠综合久久综合88| 狠狠v欧美v日韩v亚洲ⅴ| 麻豆视频一区二区| 亚洲精品美女在线| 欧美在线观看网址综合| 亚洲成色777777女色窝| 欧美日韩免费一区二区三区| 亚洲欧美中文在线视频| 欧美aⅴ99久久黑人专区| 亚洲视频专区在线| 国内视频一区| 欧美日韩亚洲一区在线观看| 一区二区三区欧美日韩| 久久精品一区二区三区不卡| 亚洲激情偷拍| 国产欧美日韩在线视频| 欧美高清在线播放| 性做久久久久久免费观看欧美| 欧美福利电影网| 性亚洲最疯狂xxxx高清| 亚洲黄页视频免费观看| 国产精品久久77777| 免费精品99久久国产综合精品| 宅男在线国产精品| 欧美高清一区| 久久美女艺术照精彩视频福利播放| 亚洲美洲欧洲综合国产一区| 国产一区二区三区高清在线观看| 欧美精品播放| 麻豆成人小视频| 午夜亚洲性色福利视频| 日韩亚洲欧美成人一区| 免费永久网站黄欧美| 欧美一区二区三区另类| 亚洲乱码国产乱码精品精| 狠狠色丁香久久婷婷综合_中| 欧美午夜视频在线观看| 欧美激情第1页| 久久久欧美精品sm网站| 亚洲欧美综合v| 亚洲自拍都市欧美小说| 亚洲免费av电影| 亚洲精品久久久久| 亚洲第一毛片| 欧美国产精品一区| 欧美freesex8一10精品| 快射av在线播放一区| 久久精品中文字幕一区二区三区| 亚洲一区二区影院| 亚洲视频网在线直播| 一本色道久久综合| 一区二区三区四区在线| 99精品国产福利在线观看免费| 亚洲区一区二| 亚洲精品中文在线| 亚洲老板91色精品久久| 亚洲精品久久久久久久久久久 | 欧美精品久久久久久| 欧美va天堂在线| 欧美电影专区| 欧美巨乳在线| 欧美日韩综合在线| 欧美日韩中文字幕| 国产精品乱码妇女bbbb| 国产区二精品视| 狠狠干综合网| 亚洲国产成人不卡| 亚洲人体1000| 在线亚洲一区| 欧美尤物一区| 美女脱光内衣内裤视频久久影院 | 亚洲日本成人| 一本色道久久88亚洲综合88 | 久久资源在线| 欧美激情1区2区3区| 亚洲精品国产视频| 中文一区二区在线观看| 亚洲欧美三级在线| 久久一区二区视频| 欧美日韩网址| 国产视频久久久久久久| 亚洲电影网站| 亚洲在线日韩| 老鸭窝毛片一区二区三区| 亚洲国产欧美精品| 亚洲在线免费观看| 久久手机精品视频| 欧美午夜不卡视频| 激情久久五月天| 一区二区三区四区五区在线| 欧美在线观看天堂一区二区三区 | 一区二区三区高清在线观看| 性8sex亚洲区入口| 欧美高清在线视频观看不卡| 一本到高清视频免费精品| 欧美在线综合| 欧美日韩综合久久| 在线看片一区| 亚洲欧美综合| 亚洲高清在线| 欧美一二三区精品| 欧美日一区二区三区在线观看国产免| 国产亚洲午夜| 亚洲在线观看| 亚洲春色另类小说| 欧美一级日韩一级| 国产精品av久久久久久麻豆网| 亚洲国产欧美一区| 久久精品国产第一区二区三区| 亚洲九九精品|