久久青草久久,国产婷婷色一区二区三区,在线日韩视频

字符的編碼是按照某種規(guī)則在單字節(jié)字符和多字節(jié)字符之間進行轉(zhuǎn)換的某種方法。從單字節(jié)到多字節(jié)叫做decoding，從多字節(jié)到單字節(jié)叫做encoding。在這些規(guī)則中經(jīng)常用到的無非是UTF-8和GB2312兩種。在Python中，codecs模塊提供了實現(xiàn)這些規(guī)則的方法，通過模塊公開的方法我們能夠方便地獲取某種編碼方式的Encoder和Decoder工廠函數(shù)(Factory function)，以及StreamReader、StreamWriter和StreamReaderWriter類。使用“import codecs”導入codecs模塊。 codecs模塊中重要的函數(shù)之一是lookup，它只有一個參數(shù)encoding，指的是編碼方式的名稱，即utf-8或者gb2312等等。如下示例： >>> import codecs >>> t = codecs.lookup("utf-8") >>> print t (, , , ) >>> encoder = t[0] >>> decoder = t[1] >>> StreamReader = t[2] >>> StreamWriter = t[3] lookup函數(shù)返回一個包含四個元素的TUPLE，其中t[0]是encoder的函數(shù)引用，t[1]是decoder的函數(shù)引用，t[2]是UTF-8編碼方式的StreamReader類對象引用，t[3]是UTF-8編碼方式的StreamWriter類對象引用相信對Python熟悉的你肯定知道接下來該怎么用它們了。 codecs模塊還提供了方便程序員使用的單獨函數(shù)，以簡化對lookup的調(diào)用。它們是： getencoder(encoding) getdecoder(encoding) getreader(encoding) getwriter(encoding) 如果我們只是想獲取一種utf-8編碼的encoder方法，那么只需要這樣做： >>> encoder = codecs.getencoder("utf-8") 另外，對于StreamReader和StreamWriter的簡化，codecs模塊提供一個open方法。相對于built-in對象File的open方法，前者多了三個參數(shù)encoding, errors, buffering。這三個參數(shù)都是可選參數(shù)，但是對于應(yīng)用來說，需要明確指定encoding的值，而errors和buffering使用默認值即可。使用方法如下： >>> fin = codecs.open("e:\\mycomputer.txt", "r", "utf-8") >>> print fin.readline() 這是我的電腦 >>> fin.close() 總結(jié)一下，codecs模塊為我們解決的字符編碼的處理提供了lookup方法，它接受一個字符編碼名稱的參數(shù)，并返回指定字符編碼對應(yīng)的encoder、decoder、StreamReader和StreamWriter的函數(shù)對象和類對象的引用。為了簡化對lookup方法的調(diào)用，codecs還提供了getencoder(encoding)、getdecoder(encoding)、getreader(encoding)和getwriter(encoding)方法；進一步，簡化對特定字符編碼的StreamReader、StreamWriter和StreamReaderWriter的訪問，codecs更直接地提供了open方法，通過encoding參數(shù)傳遞字符編碼名稱，即可獲得對encoder和decoder的雙向服務(wù)。

發(fā)表于 2007-09-06 23:29 明明閱讀(219) 評論(0) 編輯收藏引用

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

轉(zhuǎn)載: python 編碼問題

常用鏈接

留言簿(3)

隨筆檔案(43)

文章檔案(6)

相冊

收藏夾(1)

精彩網(wǎng)站

優(yōu)秀博客

搜索

最新評論

閱讀排行榜

評論排行榜