字符編碼總結(jié)
人們制定了一個(gè)表,表里面包含要表示的文字:character set 給每個(gè)字標(biāo)號(hào):coded character set 每個(gè)編號(hào)轉(zhuǎn)化為計(jì)算機(jī)存儲(chǔ)形式:character encoding form unicode制定了一個(gè)表,一堆字為他們標(biāo)號(hào),每個(gè)字得到一個(gè)code point,范圍:0x0~0x10ffff,中間有段是空的,沒有映射任何字轉(zhuǎn)化為計(jì)算機(jī)形式,這個(gè)轉(zhuǎn)化方法有多種模式,UTF-8,UTF-16等 對于UTF-16,在BMP基本字符平面上直接用code point(碼點(diǎn))的16進(jìn)制形式表示為2個(gè)字節(jié)對于不在BMP范圍內(nèi)的特殊字符,采用兩個(gè)碼點(diǎn)共同表示,這兩個(gè)碼點(diǎn)的取值就是來自編碼過的字符集中未映射的空白區(qū)域,所以單個(gè)這種碼點(diǎn)沒有任何對應(yīng)字
posted on 2009-02-19 10:09 EiN 閱讀(122) 評論(0) 編輯 收藏 引用 所屬分類: C/C++ and ASM