原文:http://dev.csdn.net/article/39/39864.shtm
?Little Endian & Big Endian????
這個(gè)標(biāo)題中的Endian是什么意思呢?還是讓我們先來(lái)看看下面的情況,這是內(nèi)存中一個(gè)WORD值中的內(nèi)容,那么這個(gè)WORD中的值是0x1234呢,還是0x3412???
low?byte?high?byte?
0x12????? 0x34?
熟悉x86匯編的人立刻就知道這個(gè)值應(yīng)為0x3412,很對(duì),但在一些情況下,比如說(shuō)你在SGI的機(jī)器上看到這種情況,則正好相反,0x1234才是正確答案,這與CPU內(nèi)部處理數(shù)據(jù)的方式有關(guān)。這兩種處理方式都存在于不同廠商生產(chǎn)的CPU之中,在上例中若此WORD值為0x3412的,我們稱(chēng)之為little-endian,?若為0x1234的,我們稱(chēng)之為big-endian,這是兩種不同的byte?orders。MSDN中有比較精確的定義如下:
Byte?Ordering?Byte?ordering?Meaning?
big-endian?The?most?significant?byte?is?on?the?left?end?of?a?word.?
little-endian?The?most?significant?byte?is?on?the?right?end?of?a?word.?
一般來(lái)說(shuō)我們不用關(guān)心byte?ordering的問(wèn)題,但若要涉及跨平臺(tái)之間的通信和資源共享,則不得不考慮這個(gè)問(wèn)題了。也許你會(huì)說(shuō),我永遠(yuǎn)不會(huì)去用其它非x86的CPU,也許是這樣,你甚至可以不必知道我們最常用的Intel,AMD等生產(chǎn)的x86的byte?ordering是little-endian的,而且按現(xiàn)在的裝機(jī)數(shù)量來(lái)看,可以說(shuō)世界上絕大多數(shù)CPU是little-endian的,但多了解一些沒(méi)有什么壞處,也許有用上的一天,實(shí)際若您要涉及到網(wǎng)絡(luò)編程,了解一些還是有所幫助的,看完本文后您就應(yīng)該知道為何socket編程中為何要用到如?ntohl,?htonl,?ntohs,?htons這幾個(gè)看起來(lái)名字似乎怪怪的API了,也很容易理解這些函數(shù)名的意義了。
假設(shè)我們要在不同byte?ordering的機(jī)器之間傳輸和交換數(shù)據(jù),那該怎么辦呢,有兩個(gè)方法,一是全部轉(zhuǎn)換成文本來(lái)傳輸(如XML使用的),另一個(gè)方法兩方都按照某一方的byte?order,這時(shí)就涉及到了不同byte?order之間相互轉(zhuǎn)換的問(wèn)題(網(wǎng)絡(luò)傳輸標(biāo)準(zhǔn)如TCP/IP采用第二種方法并且由于歷史的原因,byte?ordering是big-endian的)。兩種之間該如何轉(zhuǎn)換呢?方法有很多,我們可以先看看MFC中在處理serialize的代碼中所用的方法(List),?雖然代碼應(yīng)該是高效易讀的,?但我個(gè)人并不喜歡它,?原因是我覺(jué)得這不是一種通用優(yōu)美的方法.下面列出的是我自己寫(xiě)的轉(zhuǎn)換的代碼:
template
F3D_INLINE?T ConvertEndian(T??t)
{?
???T tResult?=?0;?
???for?(int??I?=?0;?I?<?sizeof(T);?++?I)?
???{?
??????tResult?<<=?8;????
??????tResult?|=?(t?&?0xFF)?;?
??????t?>>=?8;?
???}?
???return??tResult;
}
原理非常簡(jiǎn)單,交換字節(jié)順序,我就不多說(shuō)了,當(dāng)然這個(gè)寫(xiě)法并不是快速的,?只是通用的(我沒(méi)條件試,?若有不對(duì)之處請(qǐng)指出),?若要快速的代碼,可以在不同platform上用與platform相關(guān)的代碼,?如在PowerPC上有?"load?word?byte-reversed?indexed"?(lwbrx)?和?"load?halfword?byte-reversed?indexed"?(lhbrx)?指令,?在x86上還可用BSWAP單個(gè)匯編指令等,在類(lèi)型上專(zhuān)為int16,?int32寫(xiě)的通用的代碼也可以比這快得多.?
當(dāng)然如果在byte?ordering相同的情況下,應(yīng)該不必用這個(gè)轉(zhuǎn)換函數(shù),所以我們可以定義一個(gè)宏來(lái)處理不同的byte?ordering,也可以在運(yùn)行時(shí)測(cè)試byte?ordering,?下面的代碼給出了一個(gè)簡(jiǎn)單的測(cè)試方法。?
//?Test?for?endianness.
F3D_INLINE?bool IsLittleEndian(void)
{?
???DWORD dwTestValue?=?0x12345678L;?
???return??(*((BYTE*)&dwTestValue)?==?0x78);
}
但是float比較怪,有可能所涉及到不僅僅是byte?order的問(wèn)題,因?yàn)橛行┢脚_(tái)如Alpha不使用IEEE的浮點(diǎn)格式,還得自己轉(zhuǎn)換。當(dāng)然同上,其它的方法一是將所用的float用文本方式輸入輸出,另一個(gè)辦法是在某些情況下可將其轉(zhuǎn)換成定點(diǎn)數(shù)再處理,這里我不再深入。
如果是讀寫(xiě)第三方已經(jīng)指定byte?order的文件或數(shù)據(jù)流,比如說(shuō)讀SGI的位圖文件格式,則可以直接自行按指定的byte?order拼起來(lái),不必考慮host機(jī)是何種byte?ordering。下面我給出相應(yīng)的代碼:
//?Read?a?little-endian?TYPE?from?address
template
F3D_INLINE?T GetLittleEndian(const?BYTE*??pBuf)
{?
???T tResult?=?0;?
???pBuf?+=?sizeof(T)?-?1;?
???for?(int??I?=?0;?I?<?sizeof(T);?++?I)?
???{?
??????tResult?<<=?8;?
??????tResult?|=?*pBuf?--;?
???}?
???return??tResult;
}
//?Read?a?big-endian?TYPE?from?address
template
F3D_INLINE?T GetBigEndian(const?BYTE*??pBuf)
{?
???T tResult?=?0;?
???for?(int??I?=?0;?I?<?sizeof(T);?++?I)?
???{?
??????tResult?<<=?8;?
??????tResult?|=?*pBuf?++;?
???}?
???return??tResult;
}
//?Set?a?little-endian?TYPE?on?a?address
template
F3D_INLINE?void SetLittleEndian(BYTE*??pBuf,?T??t)
{?
???for?(int??I?=?0;?I?<?sizeof(T);?++?I)?
???{?
???*pBuf?++?=?BYTE(t?&?0xFF);?
???t?>>=?8;?
???}
}
//?Set?a?big-endian?T?on?a?address
template
F3D_INLINE?void SetBigEndian(BYTE*??pBuf,?T??t)
{?
???pBuf?+=?sizeof(T)?-?1;?
???for?(int??I?=?0;?I?<?sizeof(T);?++?I)?
???{?
??????*pBuf?--?=?BYTE(t?&?0xFF);?
??????t?>>=?8;?
???}
}
從上文可以看出,byte?order挺簡(jiǎn)單的,一般應(yīng)用中可能也用不上,但若您對(duì)寫(xiě)跨平臺(tái)的程序有興趣,則一定要了解的比較清楚才行。以上代碼都是從實(shí)際使用的源碼中取下來(lái)的。?
附:常見(jiàn)Processor,?OS的byte?ordering情況
Processor?OS?Order?
x86?(Intel,?AMD,?…?)?All?little-endian?
DEC?Alpha?All?little-endian?
HP-PA?NT?little-endian?
HP-PA?UNIX?big-endian?
SUN?SPARC?All??big-endian?
MIPS?NT?little-endian?
MIPS?UNIX?big-endian?
PowerPC?NT?little-endian?
PowerPC?non-NT?big-endian?
RS/6000?UNIX?big-endian?
Motorola?m68k?All?big-endian?