• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            C小加

            厚德 博學(xué) 求真 至善 The bright moon and breeze
            posts - 145, comments - 195, trackbacks - 0, articles - 0
              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理
            寫(xiě)一個(gè)文本處理程序,查找文本中n個(gè)出現(xiàn)頻率最高的單詞,輸出的結(jié)果需要顯示這些單詞出現(xiàn)的次數(shù),并按照次數(shù)從大到小排序。

            把問(wèn)題分成六個(gè)步驟:

            1,將文本以一行一個(gè)單詞的形式顯示出來(lái)

            2,將大寫(xiě)字母轉(zhuǎn)換成小寫(xiě)

            3,對(duì)單詞進(jìn)行排序

            4,對(duì)排序好的單詞列表統(tǒng)計(jì)每個(gè)單詞出現(xiàn)的次數(shù)

            5,按照出現(xiàn)的次數(shù)排序

            6,顯示單詞列表的前n行

            腳本的代碼如下:


            #topn.sh腳本

            #
            !/bin/bash

            end
            =$1     #1

            cat $
            2 |      #2

            tr 
            -cs "[a-z][A-Z]" "[\012*]" |      #3

            tr A
            -Z a-|      #4

            sort 
            |      #5

            uniq 
            -|      #6

            sort 
            -k1nr -k2 |       #7

            head 
            -n"$end"       #8


            #1:$1為第一個(gè)參數(shù),表示輸出頻率最高的行數(shù)

            #2:$2為第二個(gè)參數(shù),表示目標(biāo)文本,使用cat把目標(biāo)文本輸入管道,|為管道符

            #3:tr命令的-c選項(xiàng)用于選定不在”[a-z][A-Z]”字符集內(nèi)的字符,tr命令將選定的字符轉(zhuǎn)換成換行符,\012是換行符的八進(jìn)制碼,*表示將換行符任意擴(kuò)展,使其等于被替換的字符集個(gè)數(shù),這樣就將所有非字母的符號(hào)轉(zhuǎn)換為換行符,從而將文本文件以一行一個(gè)單詞的形式顯示出來(lái)。-s刪除所有重復(fù)出現(xiàn)的字符序列,只保留一個(gè)。最后把得到的結(jié)果輸入管道。

            #4:tr把大寫(xiě)字母轉(zhuǎn)化成小寫(xiě)字母

            #5:把分好的單詞進(jìn)行排序

            #6:uniq對(duì)排序好的單詞列表統(tǒng)計(jì)每個(gè)單詞出現(xiàn)的次數(shù),并刪除相鄰重復(fù)行,-c 在輸出行前面加上每行在輸入文件中出現(xiàn)的次數(shù)。 這樣就得到了出現(xiàn)的頻率及其對(duì)應(yīng)的單詞。

            #7:用sort按照出現(xiàn)的頻率從大大小排序,頻率相同的按照字母排序。-k1表示按照第一域進(jìn)行排序,-k2為按照第二域進(jìn)行排序,先按照第一域排序如果第一域相等再按照第二域排序,-n表示數(shù)字,-r表示從大到小排序

            #8:head 輸出前n行


            輸出結(jié)果:

            root@lNotebook-PC:/home/lwx/myshelltest# ./topn.sh 5 test .txt
            13 qwe
            12 qw
            11 eqw
            8 sdf
            7 we

            Feedback

            # re: 一天一個(gè)shell實(shí)例(1)文本中n個(gè)出現(xiàn)頻率最高的單詞  回復(fù)  更多評(píng)論   

            2013-06-04 09:39 by ikodota
            如何支持中文呢?
            99久久精品国产一区二区三区 | 国产精品久久新婚兰兰| 久久精品国产亚洲Aⅴ香蕉| 久久久久亚洲AV成人网人人网站| 欧美亚洲日本久久精品| 热re99久久精品国99热| 欧美亚洲国产精品久久蜜芽| 久久综合五月丁香久久激情| 国产精品久久久久影院嫩草 | 亚洲精品国产第一综合99久久| 久久精品国产亚洲AV久| 久久久综合九色合综国产| 久久男人AV资源网站| 亚洲精品乱码久久久久久自慰| 久久久久久亚洲精品不卡| 无码人妻久久一区二区三区免费 | 久久亚洲日韩看片无码| 亚洲成色999久久网站| 亚洲AV乱码久久精品蜜桃| 久久强奷乱码老熟女网站 | 亚洲国产精品无码久久| 亚洲国产成人精品女人久久久| 国产精品久久久久久久久免费| 一级a性色生活片久久无少妇一级婬片免费放 | 久久精品无码一区二区三区日韩 | 久久综合九色综合久99| 伊人久久大香线蕉综合网站| 亚洲婷婷国产精品电影人久久| 久久久久这里只有精品 | 精品国产VA久久久久久久冰| 一本色道久久88精品综合| 久久婷婷五月综合97色| a高清免费毛片久久| 国产毛片久久久久久国产毛片| 久久男人中文字幕资源站| 模特私拍国产精品久久| 久久精品www人人爽人人| 久久99国产精品一区二区| 欧美国产成人久久精品| 99久久国产综合精品麻豆| 久久国产V一级毛多内射|