• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            清風(fēng)竹林

            ぷ雪飄絳梅映殘紅
               ぷ花舞霜飛映蒼松
                 ----- Do more,suffer less

            Python Challenge lv2: ocr

              題目鏈接: http://www.pythonchallenge.com/pc/def/ocr.html
              根據(jù)提示,題目要求是從html頁面源文件的一段文本中找出rare characters。 何為rare,暫時不知道,不過不要緊,先把整段文本存放于一個叫fin.txt的文件中,預(yù)處理一下:

            if __name__ == '__main__':
                
                finpath 
            = 'fin.txt'
                with open(finpath) as fin:
                    
            # translate text into a single string
                    text = ''.join([line.rstrip() for line in fin.read()])
                    
                    d
            = {}
                    
            for c in text:
                        d[c] 
            = d.get(c, 0) +1
                    
                    
            for k, v in d.items():
                        
            print(k, v)

            輸出結(jié)果:

            ! 6079
            # 6115
            % 6104
            $ 6046
            & 6043
            ) 6186
            ( 6154
            + 6066
            * 6034
            @ 6157
            [ 6108
            ] 6152
            _ 6112
            ^ 6030
            a 1
            e 1
            i 1
            l 1
            q 1
            u 1
            t 1
            y 1
            { 6046
            } 6105

              好了,很顯然了, rare characters指的就是個數(shù)為1的這幾個字母, 于是將代碼稍微改一下即可打印得到結(jié)果:

            if __name__ == '__main__':
                
                finpath 
            = 'fin.txt'
                with open(finpath) as fin:
                    
            # translate text into a single string
                    text = ''.join([line.rstrip() for line in fin.read()])
                    
                    d
            = {}
                    
            for c in text:
                        d[c] 
            = d.get(c, 0) +1
                        
                    
            print(''.join([c for c in text if d[c] ==1]))

              程序輸出: equality
              
              考慮到結(jié)果集中未輸出的都是非字母,因此可以考慮如下方法求解:
            if __name__ == '__main__':
                
                finpath 
            = 'fin.txt'
                with open(finpath) as fin:
                    
            # translate text into a single string
                    text = ''.join([line.rstrip() for line in fin.read()])
                    
            # only print letters
                    print(''.join([c for c in text if c.isalpha()]))
                    
            # another method
                    print(''.join(filter(lambda x: x.isalpha(), text)))

              參考答案

            posted on 2009-05-11 15:40 李現(xiàn)民 閱讀(1239) 評論(0)  編輯 收藏 引用 所屬分類: python

            国内精品久久久久久久久| 性做久久久久久久| 蜜桃麻豆www久久| 久久精品国产亚洲AV无码偷窥| 久久99热这里只有精品国产| 亚洲伊人久久成综合人影院 | 亚洲国产视频久久| 久久久99精品成人片中文字幕| 秋霞久久国产精品电影院| 99久久精品国产高清一区二区| 久久久无码精品亚洲日韩按摩| 久久久久久亚洲Av无码精品专口| 午夜欧美精品久久久久久久| 久久久久久曰本AV免费免费| 久久亚洲精品国产亚洲老地址| 一级做a爰片久久毛片毛片| 99久久精品国产一区二区| 亚洲国产欧美国产综合久久| 国产精品99久久免费观看| 久久综合久久久| 中文字幕无码久久人妻| 无码人妻久久久一区二区三区| 精品熟女少妇a∨免费久久| 99久久精品毛片免费播放| 99久久综合狠狠综合久久| 亚洲人成无码网站久久99热国产| 久久婷婷人人澡人人爽人人爱 | 99精品国产综合久久久久五月天 | 国产亚洲欧美精品久久久| 91精品国产综合久久精品| 久久久久国产精品麻豆AR影院| 老男人久久青草av高清| 99久久成人国产精品免费| 伊人久久大香线蕉AV一区二区| 久久久久亚洲精品无码蜜桃| 丰满少妇人妻久久久久久4| 久久人人爽人人爽人人片AV不 | 久久不射电影网| 狠狠色丁香婷婷久久综合五月| 国内精品久久久久| 久久久久亚洲av成人网人人软件|