人們制定了一個表,表里面包含要表示的文字:character set 給每個字標號:coded character set 每個編號轉化為計算機存儲形式:character encoding form unicode制定了一個表,一堆字為他們標號,每個字得到一個code point,范圍:0x0~0x10ffff,中間有段是空的,沒有映射任何字轉化為計算機形式,這個轉化方法有多種模式,UTF-8,UTF-16等 對于UTF-16,在BMP基本字符平面上直接用code point(碼點)的16進制形式表示為2個字節對于不在BMP范圍內的特殊字符,采用兩個碼點共同表示,這兩個碼點的取值就是來自編碼過的字符集中未映射的空白區域,所以單個這種碼點沒有任何對應字