• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            各搜索引擎搜索結(jié)果的獲取

            用http的get方法,構(gòu)造要查詢(xún)的url,get下來(lái),分析結(jié)果頁(yè)面即可
            首先是構(gòu)造url,以下是一些示例,主要看清楚?號(hào)后面的參數(shù)所代表的意思即可:
            http://www.google.cn/search?num=100&&q=%E5%85%83%E6%90%9C%E7%B4%A2&start=10

            http://www.baidu.com/s?wd=%D4%AA%CB%D1%CB%F7&rn=100&pn=10  //第二頁(yè)pn

            http://www.yahoo.cn/s?p=%E5%85%83%E6%90%9C%E7%B4%A2&b=10  //第二頁(yè)b

            http://search.yahoo.com/search?n=100&p=%E5%85%83%E6%90%9C%E7%B4%A2&b=101

            http://cnweb.search.live.com/results.aspx?q=%E5%85%83%E6%90%9C%E7%B4%A2&first=51  //第二頁(yè)first=51

            http://p.zhongsou.com/p?w=%D4%AA%CB%D1%CB%F7&b=3  //b=3表示第三頁(yè)

            http://www.soso.com/q?w=%D4%AA%CB%D1%CB%F7&num=20&pg=1 //第一頁(yè),每頁(yè)20個(gè)

            第二步是解釋搜索結(jié)果頁(yè)面:

            <meta http-equiv="content-type" content="text/html;charset=gb2312">

            Google
            搜索結(jié)果個(gè)數(shù)的字符串前綴:約有<b> //獲取個(gè)數(shù)用字符串定位的方式
            搜索結(jié)果開(kāi)始的標(biāo)簽:<div id=res> //也可以用字符串定位的方式,要準(zhǔn)確就用查找標(biāo)簽定位的方式
             各個(gè)搜索結(jié)果的開(kāi)始標(biāo)簽:<div class=g> //字符串定位的方式
             
              搜索結(jié)果的url在第一個(gè)<a target=_blank class=l>標(biāo)簽里頭
              搜索結(jié)果的標(biāo)題在<a></a>的標(biāo)簽之間

              搜索結(jié)果的摘要在接下來(lái)的<table><tr><td>標(biāo)簽里頭直到<b>...<b><br>
              搜索結(jié)果的重寫(xiě)的url在<b>...<b><br>之后的<span>標(biāo)簽里頭,格式為:url,一個(gè)空格,網(wǎng)頁(yè)大小
              搜索結(jié)果的網(wǎng)頁(yè)快照在接下來(lái)的<a class=fl>的標(biāo)簽里頭,屬性中有url,標(biāo)簽之間有網(wǎng)頁(yè)快照文字
              接下來(lái)還有類(lèi)似網(wǎng)頁(yè)等,都在<a class=fl>標(biāo)簽里頭

             各個(gè)搜索結(jié)果的結(jié)束標(biāo)簽是</td></tr></table></div>

            ......................

            相關(guān)搜索的開(kāi)始標(biāo)簽:<p class=e>
            在接下來(lái)的各個(gè)<a></a>標(biāo)簽之間的內(nèi)容就是相關(guān)搜索的內(nèi)容
            直到標(biāo)簽<br clear=all>就可以結(jié)束了

             

            Baidu
            搜索結(jié)果個(gè)數(shù)的字符串前綴:<td align=\"righ,在定位該字符串后,直到</td>,即在這個(gè)td標(biāo)簽之內(nèi)含有的字符串包含相關(guān)網(wǎng)頁(yè)數(shù)和用時(shí)
            搜索結(jié)果開(kāi)始的標(biāo)簽:<DIV id=ScriptDiv></DIV>
             各個(gè)搜索結(jié)果的開(kāi)始標(biāo)簽:<table

              搜索結(jié)果的url在第一個(gè)<a target=_blank class=l>標(biāo)簽里頭
              搜索結(jié)果的標(biāo)題在<a></a>的標(biāo)簽之間,以<br>標(biāo)簽結(jié)束
              
              搜索結(jié)果的摘要以<br>開(kāi)始直到下一個(gè)<br>標(biāo)簽
              
              接下來(lái)的一行(<br>換行)的font標(biāo)簽中有搜索結(jié)果url的重寫(xiě),一個(gè)空格,網(wǎng)頁(yè)大小,網(wǎng)頁(yè)時(shí)間
              在接下來(lái)會(huì)有一些<a>標(biāo)簽如百度快照,直到又一個(gè)<br>

             然后搜索結(jié)果的結(jié)束標(biāo)簽</table>

            .........................

            導(dǎo)航條的開(kāi)始標(biāo)簽:<br clear=all>
            導(dǎo)航條的內(nèi)容在開(kāi)始標(biāo)簽之后的<div class="p"></div>標(biāo)簽之間
            相關(guān)搜索在接下來(lái)的<div>標(biāo)簽之間的各個(gè)<a>標(biāo)簽之內(nèi)

            其他考慮:對(duì)于字符串的匹配可以利用kmp,注意到匹配搜索結(jié)果各部分的時(shí)候所用到的模式字符串的最大前綴字符串最多是一個(gè)字符,這樣可以避免求取最大前綴字符串從而提高效率;如果要精確地匹配還需要弄兩個(gè)函數(shù),一個(gè)用來(lái)構(gòu)造標(biāo)簽,一個(gè)用來(lái)讀取標(biāo)簽之間的文本。

            posted on 2008-01-10 20:50 zlf 閱讀(1917) 評(píng)論(1)  編輯 收藏 引用

            評(píng)論

            # re: 各搜索引擎搜索結(jié)果的獲取 2008-12-01 19:44 boyeco

            我們?cè)趺从胓oogle或baidu的搜索結(jié)果生成我們自己想要的頁(yè)面哪?比如搜索元搜索的結(jié)果按我們想要的頁(yè)面從新生成一個(gè)頁(yè)面,要用get等方法從搜索出結(jié)果后的頁(yè)面的腳本里或得url嗎?
              回復(fù)  更多評(píng)論   


            只有注冊(cè)用戶(hù)登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問(wèn)   Chat2DB   管理


            導(dǎo)航

            <2008年1月>
            303112345
            6789101112
            13141516171819
            20212223242526
            272829303112
            3456789

            統(tǒng)計(jì)

            常用鏈接

            留言簿(1)

            隨筆檔案

            文章檔案

            搜索

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            狠狠色狠狠色综合久久| 品成人欧美大片久久国产欧美| 无码国内精品久久人妻蜜桃| 久久黄色视频| 青青青青久久精品国产| 国产成人久久AV免费| 麻豆亚洲AV永久无码精品久久| 亚洲欧美精品一区久久中文字幕| 精品国产热久久久福利| 久久久久免费精品国产| 久久精品九九亚洲精品天堂| 91精品国产91久久综合| 一级做a爰片久久毛片人呢| 99久久国产综合精品成人影院 | 亚洲七七久久精品中文国产 | 亚洲AV无码一区东京热久久| 99精品国产综合久久久久五月天| 久久精品国产99国产精品亚洲| 久久久亚洲裙底偷窥综合| 麻豆亚洲AV永久无码精品久久| 国产午夜久久影院| 狠狠色丁香婷婷综合久久来来去| 久久国产精品二国产精品| 漂亮人妻被中出中文字幕久久| 久久99热这里只有精品国产| 久久人人爽人人爽人人片av高请| 久久99国产精品二区不卡| 久久久久久A亚洲欧洲AV冫| 综合人妻久久一区二区精品 | 成人妇女免费播放久久久| 国内精品久久久久久久涩爱 | 国产亚洲综合久久系列| 国产精品99久久不卡| 午夜天堂精品久久久久| 国产高清美女一级a毛片久久w| 久久综合久久美利坚合众国| 美女写真久久影院| 亚洲午夜久久久久久久久电影网| 精品无码久久久久久久动漫| 久久亚洲精品国产精品| 欧美久久天天综合香蕉伊|