• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

            最短摘要的生成

            這個問題在《編程之美》中提到過。前幾天百度三面的時候也問到了這個問題,當時沒有答上來。從新翻閱了一下《編程之美》。
            直觀的解決方案是:
            從文檔第一個詞開始遍歷,尋找后面的詞是否與關鍵詞數組匹配
            然后從文檔第二個、第三個 ... 一直到最后一個詞遍歷

            這個過程要記錄最短文摘的信息。
            這個時間復雜度是 O(N ^ 2 * M)
            N 是文檔的長度
            M 是關鍵詞數組的大小

            改進的方法是:
            對于求的的一個文摘,記錄第一次出現關鍵詞的位置,然后直接移動到該關鍵詞,然后右邊的邊界再向后移動。
            這個時間復雜度是 O(N)
            這種方法也就是說維持了一個摘要滑動窗口,一遍掃描文檔即可得到相應的最短摘要。
            摘要中的關鍵詞可以用一個隊列來存儲,因為摘要滑動窗口的左邊界和右邊界都是要從左到右移動的。所以隊列正好適用。另外還應該維持一個對應文摘滑動窗口中的關鍵詞出現的次數表。在做左右邊界移動時需要考量這個次數表所提供的信息。

            posted on 2011-07-03 20:34 unixfy 閱讀(1093) 評論(0)  編輯 收藏 引用
            国产精品99久久不卡| 日韩精品久久久久久免费| 久久精品视频网| 观看 国产综合久久久久鬼色 欧美 亚洲 一区二区| 欧美精品久久久久久久自慰| avtt天堂网久久精品| 色偷偷91久久综合噜噜噜噜| 亚洲精品乱码久久久久久 | 久久国产高清一区二区三区| 色婷婷噜噜久久国产精品12p | 精品熟女少妇AV免费久久 | 国产精品久久久天天影视香蕉| 久久久久久亚洲精品影院| 久久精品蜜芽亚洲国产AV| 久久精品国产一区二区三区不卡| 中文字幕乱码久久午夜| 精品无码人妻久久久久久 | 久久这里只有精品首页| 欧美亚洲另类久久综合| 久久精品国产亚洲AV无码娇色| 女同久久| 久久se精品一区精品二区国产| 久久久久99精品成人片直播| 国产精品久久久久免费a∨| 久久九九久精品国产免费直播| 91精品免费久久久久久久久| 久久精品aⅴ无码中文字字幕重口 久久精品a亚洲国产v高清不卡 | 久久成人国产精品| 久久AV高潮AV无码AV| 合区精品久久久中文字幕一区| 精品久久久久久久中文字幕| 国产情侣久久久久aⅴ免费| 久久婷婷是五月综合色狠狠| 日韩中文久久| 国产69精品久久久久观看软件| 亚洲精品成人久久久| 亚洲精品乱码久久久久久蜜桃| 欧美成人免费观看久久| 国产aⅴ激情无码久久| 久久久无码精品亚洲日韩京东传媒 | 成人久久免费网站|