posts - 4, comments - 2, trackbacks - 0

工作中碰到這些問題，不太了解，問了一下，被BS了，今天看了些資料，大致總結(jié)如下：

Unicode: 用二個(gè)字節(jié)表示世界各國語言的字符，中文當(dāng)然也包括在內(nèi)，占兩個(gè)字節(jié)，英文也一律占兩上字節(jié)。所以用Unicode保存英文可能會(huì)比較浪費(fèi)空間。由于Unicode占兩個(gè)字節(jié)，比如一個(gè)漢字用unicode表示為594E，這個(gè)時(shí)候，就有字節(jié)序的問題了，到底是用big Ending寫成594E呢，還是用little Ending寫成4E59呢？

UTF-8: 也是國際通用的一種表示方法，它的單位是一個(gè)字節(jié)

0000 - 007F 0xxxxxxx 用一個(gè)字節(jié)就可以表示的字符

0080 - 07FF 110xxxxx 10xxxxxx 用二個(gè)字節(jié)保存的字符
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx 需要用三個(gè)字節(jié)保存的字符

當(dāng)讀這些二進(jìn)制流的時(shí)候，就容易辯認(rèn)出它所代表的字符。漢字是用三個(gè)字節(jié)來保存。

ANSI和GBK: ANSI英文用一個(gè)字節(jié)表示，中文的話用二個(gè)字節(jié)表示,區(qū)分中文編碼的方法是高字節(jié)的最高位不為0。

不同的國家和地區(qū)制定了不同的標(biāo)準(zhǔn)，由此產(chǎn)生了 GB2312, BIG5, JIS 等各自的編碼標(biāo)準(zhǔn)。這些使用 2 個(gè)字節(jié)來代表一個(gè)字符的各種漢字延伸編碼方式，稱為 ANSI 編碼。在簡(jiǎn)體中文系統(tǒng)下，ANSI 編碼代表 GB2312 編碼，在日文操作系統(tǒng)下，ANSI 編碼代表 JIS 編碼

posted on 2010-05-23 16:57 Robert.Hu 閱讀(224) 評(píng)論(1) 編輯收藏引用所屬分類: 零散知識(shí)

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 內(nèi)存對(duì)齊 Unicode Ansi Utf-8 編碼方式

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

<

2025年10月

>

日

一

二

三

四

五

六

28

29

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(1)

隨筆檔案

文章分類

文章檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜