美女福利精品视频,午夜宅男欧美,亚洲综合激情

一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞

Posted on 2012-09-05 17:49 C小加閱讀(3623) 評(píng)論(1) 編輯收藏引用所屬分類: Linux

寫一個(gè)文本處理程序，查找文本中n個(gè)出現(xiàn)頻率最高的單詞，輸出的結(jié)果需要顯示這些單詞出現(xiàn)的次數(shù)，并按照次數(shù)從大到小排序。

把問(wèn)題分成六個(gè)步驟：

1，將文本以一行一個(gè)單詞的形式顯示出來(lái)

2，將大寫字母轉(zhuǎn)換成小寫

3，對(duì)單詞進(jìn)行排序

4，對(duì)排序好的單詞列表統(tǒng)計(jì)每個(gè)單詞出現(xiàn)的次數(shù)

5，按照出現(xiàn)的次數(shù)排序

6，顯示單詞列表的前n行

腳本的代碼如下：

#1：$1為第一個(gè)參數(shù)，表示輸出頻率最高的行數(shù)

#2：$2為第二個(gè)參數(shù)，表示目標(biāo)文本，使用cat把目標(biāo)文本輸入管道，|為管道符

#3：tr命令的-c選項(xiàng)用于選定不在”[a-z][A-Z]”字符集內(nèi)的字符，tr命令將選定的字符轉(zhuǎn)換成換行符，\012是換行符的八進(jìn)制碼，*表示將換行符任意擴(kuò)展，使其等于被替換的字符集個(gè)數(shù)，這樣就將所有非字母的符號(hào)轉(zhuǎn)換為換行符，從而將文本文件以一行一個(gè)單詞的形式顯示出來(lái)。-s刪除所有重復(fù)出現(xiàn)的字符序列，只保留一個(gè)。最后把得到的結(jié)果輸入管道。

#4：tr把大寫字母轉(zhuǎn)化成小寫字母

#5：把分好的單詞進(jìn)行排序

#6：uniq對(duì)排序好的單詞列表統(tǒng)計(jì)每個(gè)單詞出現(xiàn)的次數(shù)，并刪除相鄰重復(fù)行，-c 在輸出行前面加上每行在輸入文件中出現(xiàn)的次數(shù)。這樣就得到了出現(xiàn)的頻率及其對(duì)應(yīng)的單詞。

#7：用sort按照出現(xiàn)的頻率從大大小排序，頻率相同的按照字母排序。-k1表示按照第一域進(jìn)行排序，-k2為按照第二域進(jìn)行排序，先按照第一域排序如果第一域相等再按照第二域排序，-n表示數(shù)字，-r表示從大到小排序

#8：head 輸出前n行

輸出結(jié)果：

root@lNotebook-PC:/home/lwx/myshelltest# ./topn.sh 5 test .txt
13 qwe
12 qw
11 eqw
8 sdf
7 we

Feedback

# re: 一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞 回復(fù) 更多評(píng)論

2013-06-04 09:39 by ikodota

如何支持中文呢？

刷新評(píng)論列表

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開(kāi)源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 一天一個(gè)shell實(shí)例（3）定時(shí)備份文件一天一個(gè)shell實(shí)例（2）生成隨機(jī)數(shù) 一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

C小加

一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞

Feedback

# re: 一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞 回復(fù) 更多評(píng)論

日歷

公告

留言簿(21)

隨筆分類(143)

隨筆檔案(145)

相冊(cè)

各大OJ入口

近期比賽

信息網(wǎng)站

友情鏈接

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

C小加

一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞

Feedback

# re: 一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞 回復(fù) 更多評(píng)論

日歷

公告

留言簿(21)

隨筆分類(143)

隨筆檔案(145)

相冊(cè)

各大OJ入口

近期比賽

信息網(wǎng)站

友情鏈接

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

# re: 一天一個(gè)shell實(shí)例（1）文本中n個(gè)出現(xiàn)頻率最高的單詞回復(fù) 更多評(píng)論