維基百科,自由的百科全書
跳轉到: 導航, 搜索
EUC全名為Extended Unix Code,是一個使用8位編碼來表示字符的方法。
它使用了一些兼容于ISO/IEC 2022區位碼的94x94編碼表,把每個區位加上0xA0來表示,以便兼容于ASCII。
它主要用于表示及儲存漢語文字、日語文字及朝鮮文字。
[編輯] EUC-CN
EUC-CN是GB 2312最常用的表示方法。瀏覽器編碼表上的“GB2312”,通常都是指“EUC-CN”表示法。
GB 2312字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xF7
“第二位字節”使用0xA1-0xFE
舉例來說,“啊”字是GB 2312之中的第一個漢字,它的區位碼是1601。
在EUC-CN之中,它把0xA0+16=0xB0,0xA0+1=0xA1,得出0xB0A1。
[編輯] EUC-JP
EUC-JP用來儲存日本JIS X 0208(舊稱JIS C 6226)及JIS X 0212字集的字符。但是,日語文字較多使用ISO-2022-JP或Shift JIS的方法來表示。
半角片假名使用兩個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xDF
JIS X 0208字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
JIS X 0212字元使用三個字節來表示。
“第一位字節”使用0x8F
“第二位字節”使用0xA1-0xFE
“第三位字節”使用0xA1-0xFE
[編輯] EUC-JISX0213
EUC-JISX0213是一個制定中的EUC規格,用來表示JIS X 0213字集的字符。
半角片假名使用兩個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xDF
JIS X 0213第一字面字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
JIS X 0213第二字面字元使用三個字節來表示。
“第一位字節”使用0x8F
“第二位字節”使用0xA1-0xFE
“第三位字節”使用0xA1-0xFE
[編輯] EUC-KR
EUC-KR用來儲存韓國KS X 1001字集(舊稱KS C 5601)的字符。此規格由KS X 2901(舊稱KS C 5861)定義。
KS X 1001字元使用兩個字節來表示。
“高位字節”使用0xA1-0xFE
“低位字節”使用0xA1-0xFE
[編輯] EUC-TW
EUC-TW本來是臺灣使用的其中一個漢字儲存方法,以CNS 11643字表為基礎。但是臺灣普遍使用大五碼,EUC-TW甚少使用。
CNS 11643第一字面的字元使用兩個字節來表示。
“第一位字節”使用0xA1-0xFE
“第二位字節”使用0xA1-0xFE
CNS 11643其他字面的字元使用四個字節來表示。
“第一位字節”使用0x8E
“第二位字節”使用0xA1-0xB0(0xA1-0xA7分別代表第1至第7個字面,其余未定義)
“第三位字節”使用0xA1-0xFE
“第四位字節”使用0xA1-0xFE
(CNS 11643第一字面可選擇使用兩個字節或四個字節來表示)
[編輯] 參看
[編輯] 參考文獻