• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

            最短摘要的生成

            這個問題在《編程之美》中提到過。前幾天百度三面的時候也問到了這個問題,當時沒有答上來。從新翻閱了一下《編程之美》。
            直觀的解決方案是:
            從文檔第一個詞開始遍歷,尋找后面的詞是否與關(guān)鍵詞數(shù)組匹配
            然后從文檔第二個、第三個 ... 一直到最后一個詞遍歷

            這個過程要記錄最短文摘的信息。
            這個時間復雜度是 O(N ^ 2 * M)
            N 是文檔的長度
            M 是關(guān)鍵詞數(shù)組的大小

            改進的方法是:
            對于求的的一個文摘,記錄第一次出現(xiàn)關(guān)鍵詞的位置,然后直接移動到該關(guān)鍵詞,然后右邊的邊界再向后移動。
            這個時間復雜度是 O(N)
            這種方法也就是說維持了一個摘要滑動窗口,一遍掃描文檔即可得到相應(yīng)的最短摘要。
            摘要中的關(guān)鍵詞可以用一個隊列來存儲,因為摘要滑動窗口的左邊界和右邊界都是要從左到右移動的。所以隊列正好適用。另外還應(yīng)該維持一個對應(yīng)文摘滑動窗口中的關(guān)鍵詞出現(xiàn)的次數(shù)表。在做左右邊界移動時需要考量這個次數(shù)表所提供的信息。

            posted on 2011-07-03 20:34 unixfy 閱讀(1086) 評論(0)  編輯 收藏 引用
            久久综合精品国产二区无码| 国产成人香蕉久久久久| 狠狠色狠狠色综合久久| 久久婷婷成人综合色综合| 久久er热视频在这里精品| 国产精品亚洲美女久久久| 久久久一本精品99久久精品88| 久久久久高潮毛片免费全部播放| 亚洲欧美日韩精品久久| 久久久久亚洲AV无码观看| 丁香狠狠色婷婷久久综合| 欧美午夜精品久久久久久浪潮| 午夜人妻久久久久久久久| 国内精品久久久久久不卡影院| 久久综合亚洲色HEZYO社区| 久久最近最新中文字幕大全| 三级片免费观看久久| 国产高清美女一级a毛片久久w| 久久精品国产2020| 日韩亚洲国产综合久久久| 久久亚洲综合色一区二区三区| 久久久无码精品亚洲日韩京东传媒| 精品国产乱码久久久久久浪潮| 久久久久久久人妻无码中文字幕爆| 亚洲精品乱码久久久久久不卡| 99久久精品国产一区二区| 久久狠狠高潮亚洲精品| 无码超乳爆乳中文字幕久久| 中文字幕精品无码久久久久久3D日动漫| 97久久精品国产精品青草| 久久香蕉国产线看观看精品yw | 奇米影视7777久久精品| 久久人人爽人人爽人人片AV东京热| 国产亚洲美女精品久久久久狼| 久久精品人成免费| 亚洲精品乱码久久久久久| 亚洲av日韩精品久久久久久a| 久久精品国产免费观看三人同眠| 久久久久av无码免费网| 精品无码久久久久国产动漫3d| 久久久噜噜噜久久中文字幕色伊伊 |