• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            小明思考

            高性能服務器端計算
            posts - 70, comments - 428, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

            [Tips]如何識別字符編碼

            Posted on 2006-09-27 10:00 小明 閱讀(3188) 評論(2)  編輯 收藏 引用 所屬分類: Tools
            如果哪一天你的程序收到一段不明編碼的字符串,或者別人給了一個你看不懂的文本文件,你應該如何去識別字符串的編碼呢?

            一種是程序中用的方法,可以使用ICU之類的庫來幫你識別,如果你的字符串越長,它所能猜到的概率就越大。

            另外一種方法是使用IE來幫助你查看。使用IE打開不明編碼的文件,然后選擇Encoding,不停的切換編碼,基本上看起來像文字的時候,就是那個編碼了:).這個方法很簡單,比較實用。

            另外對于unicode的編碼,觀察其BOM,也有助于你去猜測編碼。
            UTF-8: EF BB BF E6 B5 8B E8 AF 95 31 32 33 34
            UTF-16: FF FE 4B 6D D5 8B 31 00 32 00 33 00 34 00
            UTF-16 Big endian : FE FF 6D 4B 8B D5 00 31 00 32 00 33 00 34


            最后附上兩個小工具,能幫你生成各種文字的字符和識別字符在不同code page下的編碼。just have fun

            http://www.shnenglu.com/Files/sandy/encoding_tools.rar

            Feedback

            # re: [Tips]如何識別字符編碼  回復  更多評論   

            2006-09-27 12:24 by shaker
            這個只能說是文件啦 如果只是單純的字符串肯定是不能這樣的

            # re: [Tips]如何識別字符編碼  回復  更多評論   

            2008-01-30 11:56 by tip
            可以分享一下兩個小工具的源碼嗎?javabrew@126.com
            久久无码一区二区三区少妇| 精品无码久久久久国产| 久久91精品国产91久久户| 97久久超碰国产精品2021| 久久精品国产免费| 久久天天躁狠狠躁夜夜2020老熟妇| 国产亚洲成人久久| 人妻精品久久无码专区精东影业 | 精品久久久久久无码人妻蜜桃| 国产精品热久久无码av| 欧美伊人久久大香线蕉综合| 精品人妻久久久久久888| 久久久久久久久久久免费精品 | 成人免费网站久久久| 久久精品亚洲男人的天堂| 无码人妻久久一区二区三区免费 | 996久久国产精品线观看| 久久国产成人精品国产成人亚洲| 久久天天躁狠狠躁夜夜avapp| 久久丫精品国产亚洲av| 亚洲国产日韩欧美综合久久| 久久中文娱乐网| 亚洲va久久久噜噜噜久久狠狠 | 狠狠色婷婷久久综合频道日韩| 狠狠色丁香久久婷婷综合五月| 亚洲国产一成久久精品国产成人综合 | 曰曰摸天天摸人人看久久久| 久久久久青草线蕉综合超碰| 精品久久人人做人人爽综合| 久久精品亚洲中文字幕无码麻豆| 久久无码高潮喷水| 欧美日韩中文字幕久久久不卡 | 日韩亚洲国产综合久久久| 久久综合国产乱子伦精品免费| 国产精品99久久久久久宅男小说| 国产成人久久777777| 亚洲国产精品热久久| 香蕉久久一区二区不卡无毒影院| 国产精品免费看久久久| 欧美熟妇另类久久久久久不卡 | 欧美久久天天综合香蕉伊|