• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            小明思考

            高性能服務器端計算
            posts - 70, comments - 428, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

            [Tips]如何識別字符編碼

            Posted on 2006-09-27 10:00 小明 閱讀(3184) 評論(2)  編輯 收藏 引用 所屬分類: Tools
            如果哪一天你的程序收到一段不明編碼的字符串,或者別人給了一個你看不懂的文本文件,你應該如何去識別字符串的編碼呢?

            一種是程序中用的方法,可以使用ICU之類的庫來幫你識別,如果你的字符串越長,它所能猜到的概率就越大。

            另外一種方法是使用IE來幫助你查看。使用IE打開不明編碼的文件,然后選擇Encoding,不停的切換編碼,基本上看起來像文字的時候,就是那個編碼了:).這個方法很簡單,比較實用。

            另外對于unicode的編碼,觀察其BOM,也有助于你去猜測編碼。
            UTF-8: EF BB BF E6 B5 8B E8 AF 95 31 32 33 34
            UTF-16: FF FE 4B 6D D5 8B 31 00 32 00 33 00 34 00
            UTF-16 Big endian : FE FF 6D 4B 8B D5 00 31 00 32 00 33 00 34


            最后附上兩個小工具,能幫你生成各種文字的字符和識別字符在不同code page下的編碼。just have fun

            http://www.shnenglu.com/Files/sandy/encoding_tools.rar

            Feedback

            # re: [Tips]如何識別字符編碼  回復  更多評論   

            2006-09-27 12:24 by shaker
            這個只能說是文件啦 如果只是單純的字符串肯定是不能這樣的

            # re: [Tips]如何識別字符編碼  回復  更多評論   

            2008-01-30 11:56 by tip
            可以分享一下兩個小工具的源碼嗎?javabrew@126.com
            久久超乳爆乳中文字幕| 色欲久久久天天天综合网精品| 人妻久久久一区二区三区| 久久久久亚洲av无码专区导航| 久久精品一区二区三区不卡| 日本国产精品久久| 久久亚洲私人国产精品| 狠狠久久综合| 久久精品天天中文字幕人妻 | 久久午夜无码鲁丝片秋霞 | 久久久高清免费视频| 无码人妻久久一区二区三区免费丨 | 99久久夜色精品国产网站| 久久免费99精品国产自在现线 | 久久九九久精品国产免费直播| 久久精品国产2020| 国产高清美女一级a毛片久久w| 中文字幕无码免费久久| 99久久综合狠狠综合久久| 2020久久精品国产免费| 伊人久久大香线蕉AV色婷婷色| 久久黄色视频| 久久免费精品一区二区| 99久久人妻无码精品系列| 久久妇女高潮几次MBA| 久久青青草原亚洲av无码| 久久婷婷综合中文字幕| 国产情侣久久久久aⅴ免费| 久久久久久久97| 久久久久久精品免费免费自慰| 香蕉久久永久视频| 久久一本综合| 一本大道久久香蕉成人网 | 伊人色综合久久天天人手人婷 | 久久精品国产福利国产秒| 久久综合给合久久狠狠狠97色69| 久久青青色综合| 国产成人无码精品久久久性色| 四虎国产精品成人免费久久| 久久精品国产亚洲av麻豆蜜芽| 亚洲国产成人久久综合一区77|