• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

            最短摘要的生成

            這個問題在《編程之美》中提到過。前幾天百度三面的時候也問到了這個問題,當時沒有答上來。從新翻閱了一下《編程之美》。
            直觀的解決方案是:
            從文檔第一個詞開始遍歷,尋找后面的詞是否與關鍵詞數組匹配
            然后從文檔第二個、第三個 ... 一直到最后一個詞遍歷

            這個過程要記錄最短文摘的信息。
            這個時間復雜度是 O(N ^ 2 * M)
            N 是文檔的長度
            M 是關鍵詞數組的大小

            改進的方法是:
            對于求的的一個文摘,記錄第一次出現關鍵詞的位置,然后直接移動到該關鍵詞,然后右邊的邊界再向后移動。
            這個時間復雜度是 O(N)
            這種方法也就是說維持了一個摘要滑動窗口,一遍掃描文檔即可得到相應的最短摘要。
            摘要中的關鍵詞可以用一個隊列來存儲,因為摘要滑動窗口的左邊界和右邊界都是要從左到右移動的。所以隊列正好適用。另外還應該維持一個對應文摘滑動窗口中的關鍵詞出現的次數表。在做左右邊界移動時需要考量這個次數表所提供的信息。

            posted on 2011-07-03 20:34 unixfy 閱讀(1087) 評論(0)  編輯 收藏 引用
            少妇熟女久久综合网色欲| 婷婷综合久久狠狠色99h| 天天影视色香欲综合久久| 人人狠狠综合88综合久久| 伊人久久久AV老熟妇色| 久久久av波多野一区二区| 国产精品久久久久久久午夜片| 亚洲精品乱码久久久久久不卡| 久久妇女高潮几次MBA| 久久夜色精品国产亚洲| 伊人精品久久久久7777| 国产精品久久毛片完整版| 久久经典免费视频| 99久久精品费精品国产| 久久ZYZ资源站无码中文动漫| 国产女人aaa级久久久级| 久久久久国产精品熟女影院| 日本亚洲色大成网站WWW久久| 国内精品人妻无码久久久影院| 久久中文精品无码中文字幕| 国产成人精品免费久久久久| 97久久婷婷五月综合色d啪蜜芽 | 亚洲av日韩精品久久久久久a| 精品无码久久久久久国产| 久久精品国产99久久无毒不卡| 亚洲国产日韩欧美久久| 久久人人爽人人爽AV片| 成人a毛片久久免费播放| 97精品久久天干天天天按摩 | 伊人色综合久久| 2021久久国自产拍精品| 精品久久久无码人妻中文字幕| 无码乱码观看精品久久| 精品国产青草久久久久福利| 四虎国产永久免费久久| 99久久国产综合精品网成人影院 | 久久青青草原综合伊人| 国产精品女同久久久久电影院| 久久久精品人妻一区二区三区四 | 亚洲日本va午夜中文字幕久久| 久久影视国产亚洲|