• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            C小加

            厚德 博學 求真 至善 The bright moon and breeze
            posts - 145, comments - 195, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理
            寫一個文本處理程序,查找文本中n個出現頻率最高的單詞,輸出的結果需要顯示這些單詞出現的次數,并按照次數從大到小排序。

            把問題分成六個步驟:

            1,將文本以一行一個單詞的形式顯示出來

            2,將大寫字母轉換成小寫

            3,對單詞進行排序

            4,對排序好的單詞列表統計每個單詞出現的次數

            5,按照出現的次數排序

            6,顯示單詞列表的前n行

            腳本的代碼如下:


            #topn.sh腳本

            #
            !/bin/bash

            end
            =$1     #1

            cat $
            2 |      #2

            tr 
            -cs "[a-z][A-Z]" "[\012*]" |      #3

            tr A
            -Z a-|      #4

            sort 
            |      #5

            uniq 
            -|      #6

            sort 
            -k1nr -k2 |       #7

            head 
            -n"$end"       #8


            #1:$1為第一個參數,表示輸出頻率最高的行數

            #2:$2為第二個參數,表示目標文本,使用cat把目標文本輸入管道,|為管道符

            #3:tr命令的-c選項用于選定不在”[a-z][A-Z]”字符集內的字符,tr命令將選定的字符轉換成換行符,\012是換行符的八進制碼,*表示將換行符任意擴展,使其等于被替換的字符集個數,這樣就將所有非字母的符號轉換為換行符,從而將文本文件以一行一個單詞的形式顯示出來。-s刪除所有重復出現的字符序列,只保留一個。最后把得到的結果輸入管道。

            #4:tr把大寫字母轉化成小寫字母

            #5:把分好的單詞進行排序

            #6:uniq對排序好的單詞列表統計每個單詞出現的次數,并刪除相鄰重復行,-c 在輸出行前面加上每行在輸入文件中出現的次數。 這樣就得到了出現的頻率及其對應的單詞。

            #7:用sort按照出現的頻率從大大小排序,頻率相同的按照字母排序。-k1表示按照第一域進行排序,-k2為按照第二域進行排序,先按照第一域排序如果第一域相等再按照第二域排序,-n表示數字,-r表示從大到小排序

            #8:head 輸出前n行


            輸出結果:

            root@lNotebook-PC:/home/lwx/myshelltest# ./topn.sh 5 test .txt
            13 qwe
            12 qw
            11 eqw
            8 sdf
            7 we

            Feedback

            # re: 一天一個shell實例(1)文本中n個出現頻率最高的單詞  回復  更多評論   

            2013-06-04 09:39 by ikodota
            如何支持中文呢?
            久久国产精品二国产精品| 久久亚洲精品国产精品| 久久精品不卡| 日日躁夜夜躁狠狠久久AV| 久久香蕉国产线看观看99| 三级三级久久三级久久| 成人久久综合网| 人人妻久久人人澡人人爽人人精品| 婷婷伊人久久大香线蕉AV| 久久电影网| 久久免费精品视频| 久久一日本道色综合久久| 久久亚洲精品无码播放| 99久久国产热无码精品免费| 中文字幕久久精品| 国产精品久久久久乳精品爆| 久久免费看黄a级毛片| 久久青青草原亚洲av无码| 久久精品中文字幕无码绿巨人 | 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区| 亚洲欧洲精品成人久久曰影片| 久久国产精品国产自线拍免费| 亚洲国产精品无码成人片久久| 久久九九久精品国产免费直播| 亚洲综合精品香蕉久久网97| 久久久久99精品成人片直播| 偷偷做久久久久网站| 久久一区二区三区免费| 久久亚洲AV无码西西人体| 国内精品欧美久久精品| 国产精品九九久久精品女同亚洲欧美日韩综合区 | 久久精品夜夜夜夜夜久久| AV无码久久久久不卡蜜桃| 伊人色综合久久天天人守人婷 | 久久天天躁狠狠躁夜夜av浪潮| 国产午夜精品理论片久久| 久久国产精品波多野结衣AV| 久久精品国产亚洲精品| 亚洲人AV永久一区二区三区久久 | 久久国产免费直播| 97久久国产综合精品女不卡|