• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            學著站在巨人的肩膀上

            金融數學,InformationSearch,Compiler,OS,

              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理 ::
              12 隨筆 :: 0 文章 :: 8 評論 :: 0 Trackbacks

            通過前面的三篇文章相信你已經對神秘的搜索引擎有了一個感性的認識,和普通的php類似的腳本語言服務器類似,通過獲取前臺關鍵字,通過字典分詞,和事先建立建立好的倒排索引進行相關性分析,得出查詢結構格式化輸出結果。而這里的技術難點在于

            1、字典的選取(事實上根據不同時代不同地方人們的語言習慣是不一樣的所以說字典的最小元的取值是不同的)

            2、倒排索引的建立(這里就要涉及到爬蟲的抓取和索引的建立后面將重點介紹這2點,搜索引擎的效率和服務質量實效性瓶頸在這里)

            3、相關性分析(對抓回來的文檔分詞建索引和用戶關鍵字分詞算法上要對應)

            后面文章會重點介紹爬蟲的抓取和索引的建立。

            posted on 2009-12-10 22:54 學者站在巨人的肩膀上 閱讀(991) 評論(0)  編輯 收藏 引用 所屬分類: 中文文本信息處理
            狠狠人妻久久久久久综合蜜桃| 手机看片久久高清国产日韩 | 亚洲一本综合久久| 国内精品久久久久久久久| 午夜精品久久久久久久无码| 久久午夜无码鲁丝片秋霞| 久久精品国产亚洲AV电影| 精品久久久无码中文字幕| 日韩人妻无码一区二区三区久久99 | 91精品国产综合久久久久久| 热re99久久精品国产99热| 麻豆精品久久久久久久99蜜桃| 国产精品一久久香蕉国产线看观看 | 国产精品亚洲美女久久久| 国产A三级久久精品| 中文字幕成人精品久久不卡| 99久久国产精品免费一区二区| 久久精品人人做人人爽电影| 亚洲午夜久久久久久久久久| 国产激情久久久久影院老熟女免费 | 色8久久人人97超碰香蕉987| 九九热久久免费视频| 狠狠色婷婷综合天天久久丁香| 久久亚洲精品国产精品婷婷| 久久综合久久性久99毛片| 91麻精品国产91久久久久| 久久精品一本到99热免费| 久久久亚洲裙底偷窥综合 | 亚洲人成无码久久电影网站| 国产亚洲婷婷香蕉久久精品 | 国产精品九九久久免费视频 | 国产午夜精品久久久久免费视 | 亚洲AV成人无码久久精品老人| 久久久久无码精品国产app| 99国内精品久久久久久久| 久久99精品久久久久久动态图| 7777久久久国产精品消防器材| 久久国产欧美日韩精品免费| 久久久久久亚洲精品无码| 少妇久久久久久被弄到高潮| 久久只有这精品99|