久久久综合网站,久久久国产一区二区三区,欧美视频导航

《編程之美》讀書筆記24： 3.5 最短摘要的生成

當初看這道題時，看了好了幾遍都沒看懂。后來總算弄明白：給出的字符串是用其它程序分好詞的，關鍵字符串也是用其它程序分好詞的，而不是按用戶直接輸入的字符串。比如書上給的例子：“微軟亞洲研究院使命”，不是按空格分成兩個關鍵詞，“微軟亞洲研究院”和“使命”，而是按其它程序分成：“微軟”、“亞洲”、“研究院”和“使命”四個關鍵詞。

“最短摘要”應該是指：包含所有關鍵字（關鍵字不要求按用戶輸入的順序排列）的長度最短的摘要。書上的解法，把“最短摘要”理解成包含所有關鍵字且詞個數最少的摘要。

弄清了問題，解決起來就很簡單：

1 反復讀入字符串，直到碰到關鍵字（可以用set或unordered_set）。

2 更新該關鍵字字符串最近出現的位置。

3 若已經找到所有的關鍵字，根據這些關鍵字的位置最小/最大值，計算摘要長度

可以用set來維護這些位置值。

（實際上，只要求維護位置的最小值，還可以自行實現一個堆結構，節省空間。）

根據位置值計算長度，需要先計算出分詞后的字符串，在未分詞的字符串的位置。

4 記錄長度最短的摘要

若有m個關鍵字，待查詢字符串有n個，時間復雜度大概為：O(n*log m)

（關鍵字一般都很短，可以認為對關鍵字間的比較、計算哈希值時間復雜度為O(1)）

另外，將關鍵字映射到數字，減少字符串比較，能進一步提高效率。

最短摘要

作者： flyinghearts
出處： http://www.cnblogs.com/flyinghearts/
本文采用知識共享署名-非商業性使用-相同方式共享 2.5 中國大陸許可協議進行許可，歡迎轉載，但未經作者同意必須保留此段聲明，且在文章頁面明顯位置給出原文連接，否則保留追究法律責任的權利。

posted on 2011-03-27 22:11 flyinghearts 閱讀(1554) 評論(0) 編輯收藏引用所屬分類: 編程之美

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 對環狀數組求連續子數組的最大和最短摘要的生成（補充）點在三角形內（1）《編程之美》讀書筆記25： 2.21只考加法的面試題《編程之美》讀書筆記24： 3.5 最短摘要的生成《編程之美》讀書筆記23： 1.1 讓CPU占用率曲線聽你指揮《編程之美》讀書筆記目錄《編程之美》讀書筆記18： 3.7 隊列中取最大數操作問題《編程之美》讀書筆記17： 2.16 求數組中最長遞增子序列《編程之美》讀書筆記16： 3.10 分層遍歷二叉樹

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

雁過無痕

留言簿(7)

隨筆分類

隨筆檔案

搜索

最新隨筆

最新評論

閱讀排行榜

評論排行榜