大小端問(wèn)題
By unanao
<sunjianjiao@gmail.com>
一、什么是大小端問(wèn)題
(From《Computer Systems,A Programer's Perspective》)在幾乎所有的機(jī)器上,多字節(jié)對(duì)象被存儲(chǔ)為連續(xù)的字節(jié)序列,對(duì)象的地址為所使用字節(jié)序列中最低字節(jié)地址。
小端:某些機(jī)器選擇在存儲(chǔ)器中按照從最低有效字節(jié)到最高有效字節(jié)的順序存儲(chǔ)對(duì)象,這種最低有效字節(jié)在最前面的表示方式被稱(chēng)為小端法(little endian) 。這樣的存儲(chǔ)模式有點(diǎn)兒類(lèi)似于把數(shù)據(jù)當(dāng)作字符串順序處理:地址由小向大增加,而數(shù)據(jù)從高位往低位放;
大端:某些機(jī)器則按照從最高有效字節(jié)到最低有效字節(jié)的順序儲(chǔ)存,這種最高有效字節(jié)在最前面的方式被稱(chēng)為大端法(big endian) 。這種存儲(chǔ)模式將地址的高低和數(shù)據(jù)位權(quán)有效地結(jié)合起來(lái),高地址部分權(quán)值高,低地址部分權(quán)值低,和我們的邏輯方法一致。
舉個(gè)例子來(lái)說(shuō)名大小端: 比如一個(gè)int x, 地址為0x100, 它的值為0x1234567. 則它所占據(jù)的0x100, 0x101, 0x102, 0x103地址組織如下圖:

二、為什么會(huì)有大小端模式之分呢?
這是因?yàn)樵谟?jì)算機(jī)系統(tǒng)中,我們是以字節(jié)為單位的,每個(gè)地址單元都對(duì)應(yīng)著一個(gè)字節(jié),一個(gè)字節(jié)為 8bit。但是在C語(yǔ)言中除了8bit的char之外,還有16bit的short型,32bit的long型(要看具體的編譯器),另外,對(duì)于位數(shù)大于 8位的處理器,例如16位或者32位的處理器,由于寄存器寬度大于一個(gè)字節(jié),那么必然存在著一個(gè)如果將多個(gè)字節(jié)安排的問(wèn)題。因此就導(dǎo)致了大端存儲(chǔ)模式和小端存儲(chǔ)模式。例如一個(gè)16bit的short型x,在內(nèi)存中的地址為0x0010,x的值為0x1122,那么0x11為高字節(jié),0x22為低字節(jié)。對(duì)于 大端模式,就將0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,剛好相反。我們常用的X86結(jié)構(gòu)是小端模式,而KEIL C51則為大端模式。很多的ARM,DSP都為小端模式。有些ARM處理器還可以由硬件來(lái)選擇是大端模式還是小端模式。
三、如何區(qū)分大小端問(wèn)題:
方法1:
1 #include <stdio.h>
2
3 int main(void)
4 {
5 int i = 1;
6 unsigned char *pointer;
7
8 pointer = (unsigned char *)&i;
9 if(*pointer)
10 {
11 printf("litttle_endian");
12 }
13 else
14 {
15 printf("big endian\n");
16 }
17
18 return 0;
19 }
C中的數(shù)據(jù)類(lèi)型都是從內(nèi)存的低地址向高地址擴(kuò)展,取址運(yùn)算"&"都是取低地址。小端方式中(i占至少兩個(gè)字節(jié)的長(zhǎng)度)則i所分配的內(nèi)存最小地址那個(gè)字節(jié)中就存著1,其他字節(jié)是0。大端的話則1在i的最高地址字節(jié)處存放,char是一個(gè)字節(jié),所以強(qiáng)制將char型量p指向i,則p指向的一定是i的最低地址,那么就可以判斷p中的值是不是1來(lái)確定是不是小端。
方法2:
1 #include <stdio.h>
2
3 int main(void)
4 {
5 union {
6 short a;
7 char ch;
8 } u;
9 u.a = 1;
10
11 if (u.ch == 1)
12 {
13 printf("Littel endian\n");
14 }
15 else
16 {
17 printf("Big endian\n");
18 }
19 }
利用聯(lián)合體的特點(diǎn),數(shù)據(jù)成員共享內(nèi)存空間,union中元素的起始地址都是相同的——位于聯(lián)合的開(kāi)始。 用char來(lái)截取感興趣的字節(jié)。
四、需要考慮大小端(字節(jié)順序)的情況
1、所寫(xiě)的程序需要向不同的硬件平臺(tái)遷移,說(shuō)不定哪一個(gè)平臺(tái)是大端還是小端,為了保證可移植性,一定提前考慮好。
2. 在不同類(lèi)型的機(jī)器之間通過(guò)網(wǎng)絡(luò)傳送二進(jìn)制數(shù)據(jù)時(shí)。 一個(gè)常見(jiàn)的問(wèn)題是當(dāng)小端法機(jī)器產(chǎn)生的數(shù)據(jù)被發(fā)送到大端法機(jī)器或者反之時(shí),接受程序會(huì)發(fā)現(xiàn),字(word)里的字節(jié)(byte)成了反序的。為了避免這類(lèi)問(wèn) 題,網(wǎng)絡(luò)應(yīng)用程序的代碼編寫(xiě)必須遵守已建立的關(guān)于字節(jié)順序的規(guī)則,以確保發(fā)送方機(jī)器將它的內(nèi)部表示轉(zhuǎn)換成網(wǎng)絡(luò)標(biāo)準(zhǔn),而接受方機(jī)器則將網(wǎng)絡(luò)標(biāo)準(zhǔn)轉(zhuǎn)換為它的內(nèi)部標(biāo)準(zhǔn)。
3. 當(dāng)閱讀表示整數(shù)的字節(jié)序列時(shí)。這通常發(fā)生在檢查機(jī)器級(jí)程序時(shí),e.g.:反匯編得到的一條指令:
80483bd: 01 05 64 94 04 08 add %eax, 0x8049464
3. 當(dāng)編寫(xiě)強(qiáng)轉(zhuǎn)的類(lèi)型系統(tǒng)的程序時(shí)。如寫(xiě)入的數(shù)據(jù)為u32型,但是讀取的時(shí)候卻是char型的。如:0x1234, 大端讀取為12時(shí),小端獨(dú)到的是34。
六、提高程序的可移植性
使用宏編譯
#ifdef LITTLE_ENDIAN
//小端的代碼
#else
//大端的代碼
#endif
七、大、小端之間的轉(zhuǎn)換
1、小端轉(zhuǎn)換為大端
1 #include <stdio.h>
2
3 void show_byte(char *addr, int len)
4 {
5 int i;
6
7 for (i = 0; i < len; i++)
8 {
9 printf("%.2x \t", addr[i]);
10 }
11 printf("\n");
12 }
13
14 int endian_convert(int t)
15 {
16 int result;
17 int i;
18
19 result = 0;
20 for (i = 0; i < sizeof(t); i++)
21 {
22 result <<= 8;
23 result |= (t & 0xFF);
24 t >>= 8;
25 }
26
27 return result;
28 }
29
30 int main(void)
31 {
32 int i;
33 int ret;
34
35 i = 0x1234567;
36
37 show_byte((char *)&i, sizeof(int));
38 ret = endian_convert(i);
39 show_byte((char *)&ret, sizeof(int));
40
41 return 0;
42 }
本文轉(zhuǎn)自:http://www.shnenglu.com/humanchao/archive/2012/12/26/196684.html
posted on 2013-01-07 16:33
王海光 閱讀(791)
評(píng)論(0) 編輯 收藏 引用 所屬分類(lèi):
算法