• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 79  文章 - 58  trackbacks - 0
            <2016年8月>
            31123456
            78910111213
            14151617181920
            21222324252627
            28293031123
            45678910

            常用鏈接

            留言簿(9)

            隨筆分類

            隨筆檔案

            文章檔案

            相冊

            搜索

            •  

            積分與排名

            • 積分 - 296544
            • 排名 - 88

            最新評論

            閱讀排行榜

            評論排行榜

            網絡上關于增量搜集網頁的資料比較少,可能還不成熟的原因。
            偶有所感啊。。。。

            獲取url之后,存放在visittable中,并保存本次的指紋信息。

            需要根據它的重要程度,初步估算一個搜集間隔。
            當到達下次搜集時間,則搜集它,這個時候,根據上下兩次的

            指紋,判斷是否有網頁是否有變化,以調整搜集間隔。
            舉例:第一次間隔10天,10天后搜集發現有變化,則調整間隔為5天。 

            5天后搜集發現無變化,則調整間隔為7.5天,以得到一個差不多的值。

            網站的重要程度也是一個方面,比如專門搜索mp3的搜索引擎,可以把
            根本沒有mp3的網站列入無效網站,把mp3較多的網站列為專業網站,
            縮小搜索間隔。

            visittable表結構:

            URLCode URL nextTime interval preInterval finger

            posted on 2008-05-22 22:23 merlinfang 閱讀(395) 評論(0)  編輯 收藏 引用 所屬分類: 搜索引擎
            久久久久国产精品人妻| 麻豆久久| 97久久精品人人澡人人爽| 狠狠人妻久久久久久综合| 伊人色综合久久天天网| 国产情侣久久久久aⅴ免费| 国产成人综合久久精品尤物| 免费久久人人爽人人爽av| 久久婷婷国产麻豆91天堂| 久久天天躁狠狠躁夜夜avapp| 久久91精品国产91久久户| 伊人久久久AV老熟妇色| 国产成人综合久久久久久| 精品国产乱码久久久久久郑州公司| 九九热久久免费视频| 久久精品国内一区二区三区| 97久久国产综合精品女不卡| 少妇被又大又粗又爽毛片久久黑人| 少妇久久久久久久久久| 精品国产乱码久久久久久呢| 国产日韩久久免费影院| 99久久777色| 久久99精品久久久久婷婷| 久久久无码精品亚洲日韩蜜臀浪潮| 91秦先生久久久久久久| 久久久久久久久久久久中文字幕| 久久久久久国产精品无码下载| 93精91精品国产综合久久香蕉 | 久久不见久久见免费影院www日本| 漂亮人妻被黑人久久精品| 精品无码久久久久国产动漫3d| 伊人久久亚洲综合影院| 一本色综合久久| 一本久久a久久精品综合香蕉 | 人妻无码久久一区二区三区免费| 久久AV无码精品人妻糸列| 久久精品人妻中文系列| 亚洲国产精品无码久久久蜜芽| 久久亚洲熟女cc98cm| 亚洲va中文字幕无码久久| 奇米综合四色77777久久|