• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

            最短摘要的生成

            這個問題在《編程之美》中提到過。前幾天百度三面的時候也問到了這個問題,當時沒有答上來。從新翻閱了一下《編程之美》。
            直觀的解決方案是:
            從文檔第一個詞開始遍歷,尋找后面的詞是否與關鍵詞數組匹配
            然后從文檔第二個、第三個 ... 一直到最后一個詞遍歷

            這個過程要記錄最短文摘的信息。
            這個時間復雜度是 O(N ^ 2 * M)
            N 是文檔的長度
            M 是關鍵詞數組的大小

            改進的方法是:
            對于求的的一個文摘,記錄第一次出現關鍵詞的位置,然后直接移動到該關鍵詞,然后右邊的邊界再向后移動。
            這個時間復雜度是 O(N)
            這種方法也就是說維持了一個摘要滑動窗口,一遍掃描文檔即可得到相應的最短摘要。
            摘要中的關鍵詞可以用一個隊列來存儲,因為摘要滑動窗口的左邊界和右邊界都是要從左到右移動的。所以隊列正好適用。另外還應該維持一個對應文摘滑動窗口中的關鍵詞出現的次數表。在做左右邊界移動時需要考量這個次數表所提供的信息。

            posted on 2011-07-03 20:34 unixfy 閱讀(1085) 評論(0)  編輯 收藏 引用
            性做久久久久久久| 欧美性大战久久久久久| 亚洲人成无码久久电影网站| 97久久天天综合色天天综合色hd | 香蕉久久夜色精品国产小说| 一本久久a久久精品亚洲| 亚洲国产高清精品线久久| 久久99精品国产麻豆婷婷| 欧美综合天天夜夜久久| 日本久久久精品中文字幕| 久久精品国产91久久综合麻豆自制| 久久国产热精品波多野结衣AV| 久久A级毛片免费观看| 色综合久久中文字幕无码| 乱亲女H秽乱长久久久| 久久精品国产亚洲AV麻豆网站| 99re久久精品国产首页2020| 久久AV高清无码| 久久精品人人做人人爽电影| 国内精品久久久久久久涩爱| 久久国产精品免费一区| 亚洲欧美国产精品专区久久| 久久国产劲爆AV内射—百度| 亚洲国产精品高清久久久| 国内精品久久久久久99蜜桃| 久久九九全国免费| 久久这里只有精品视频99| 97精品依人久久久大香线蕉97| 精品人妻久久久久久888| 丰满少妇人妻久久久久久4| 国产偷久久久精品专区| 午夜不卡888久久| 色8久久人人97超碰香蕉987| 久久精品人人做人人爽电影| 亚洲欧洲久久av| 久久精品视频网| 久久久噜噜噜久久中文福利| 久久久久一级精品亚洲国产成人综合AV区| 狠狠色狠狠色综合久久| 国产精品美女久久久免费| 狼狼综合久久久久综合网|