字節對齊指的是定義一個變量(包括常量,以下出現的變量不再特別說明)時,該變量在計算機內存區域的起始地址按照多少的倍數來存放。比如按4對齊,
則起始地址必須是4的倍數。字節對齊影響著計算機指令系統層讀寫變量的速度。這一點在計算機體系結構和匯編語言的書里面一般都有較詳細的說明,在此不多作
描述。主要總結一下編程時字節對齊的設置。
C++提供了指令來設置對齊方式。一個是pack pragma,該指令用來設置結構成員的對齊;另一個是align,用來設置整個類型的對齊。下面我們看一下這兩個指令是如何影響變量在內存的存儲的。
1、pack pragma
pack pragma設置了struct、union或class中各成員的對齊方式,結構成員對齊指的是成員相對于起始地址的偏移量。該指令基本用法如下:
#pragma pack(n)
它
指定了結構成員按n(1,2,4,8,16)字節對齊,如果未指定n,則恢復成默認值。需要注意的是,它并不是指結構體中的每個成員都要按n對齊,而是按
照每個成員的大小和n相比較小的值對齊。下面引用MSDN中C++ Preprocessor Reference部分關于pack指令的說明:
n (optional)
Specifies the value, in bytes, to be used for packing. The default value for n is 8. Valid values are 1, 2, 4, 8, and 16. The alignment of a member will be on a boundary that is either a multiple of n or a multiple of the size of the member, whichever is smaller.
即成員member的對齊值 align of member = min( pack setting value, sizeof(member) )
請看下面示例代碼:
筆者的測試環境為x86體系32位計算機 win2000操作系統,VS2003編譯器。
編譯器默認的成員對齊值是8字節,通過#pragma pack(show)指令,編譯的時候在輸出欄會限制默認對齊值。以上程序運行完通過調試的內存察看功能得到a和b的內存存儲區域如下:
a的存儲區域:0x0012FED0 02 00 00 00 31 00 03 00
b的存儲區域:0x0012FEBC 31 00 00 00 02 00 00 00 03 00 00 00
最前面的4字節整數是變量的起始地址,后面是變量的整個存儲區域。
現在我們按照 align of member = min( pack setting value, sizeof(member) )的公式分析一下a和b的存儲。
a
的第一個成員n為int,大小為4,align of a.n = min(8,sizeof(int)
),對齊值為4。第一個成員相對于結構體起始地址從0偏移開始,前四個字節02 00 00 00即為n的存儲區域,因為x86是Little
Endian(低字節在前)的字節順序,所以第一字節是2,后面三個字節0,我們通常寫成0x00000002;
a的第二個成員c為char,大小為1,align of a.c=min(8,sizeof(char)),對齊值為1。c緊接著a后面存儲從偏移4開始,滿足1字節對齊的要求。它的值為'1',ASCII碼為0x31,共一個字節31;
a的第三個成員為short,大小為2,align of a.s=min(8,sizeof(short)),對齊值為2。如果緊接第二個成員從偏移5開始存儲就不滿足2字節對齊,因此跳過1個字節,從偏移6字節的地方開始存儲,即最后兩個字節03 00;
b的第一個成員c為char,大小為1,align of a.c=min(8,sizeof(char)),對齊值為1。第一個成員從偏移起始地址0字節開始存儲,它的值為'1',ASCII碼為0x31,共一個字節31;
b
的第二個成員n為int,大小為4,align of a.n = min(8,sizeof(int)
),對齊值為4。如果緊接第二個成員后面從偏移1開始存儲就不能4字節對齊,因此跳過3個字節,從偏移4字節的地方開始存儲,即第5-8的四個字節02
00 00 00;
b的第三個成員為short,大小為2,align of a.s=min(8,sizeof(short)),對齊值為2。緊接第二個成員從偏移8字節的地方開始存儲,即9-10兩個字節03 00;
這時有人可能要問,b為什么最后多了兩個字節00 00呢?這就是我們下面要講的,整個結構體的對齊。
2、align指令
align指令可以用于設置各種內置類型、自定義類型如struct、union或class的的對齊方式。指令格式為: __declspec(align( # )) ,#是對齊值,取值為2的1次方至2的8192次方。在聲明自定義類型或內置變量時,如果指定了對齊值,則對應變量的起始地址必須是該值的整數倍。除此外,它還會影響結構體的大小。下面引用兩段MSDN關于align的描述:
Without __declspec(align( # )) ,
Visual C++ aligns data on natural boundaries based on the size of the
data, for example 4-byte integers on 4-byte boundaries and 8-byte
doubles on 8-byte boundaries. Data in classes or structures is aligned
within the class or structure at the minimum of its natural alignment
and the current packing setting (from #pragma pack or the /Zp compiler option).
從這段可以看出,如果沒有設置align(#)值,變量x按照sizeof(x)來對齊起始地址。類或結構體內的成員在類或結構體內部按照min( pack setting value,sizeof(member))來對齊。這個我們在pack指令部分已經分析過。
The sizeof
value for any structure is the offset of the final member, plus that
member's size, rounded up to the nearest multiple of the largest member
alignment value or the whole structure alignment value, whichever is
greater.
從這段可以看出,align(#)指令會影響結構體或類的大小。總結公式為:
sizeof(structure) = (結構體最后一個成員的偏移 + sizeof(結構體最后一個成員) ) 上取整 ( n* max( 結構體各成員的對齊值,align(#)設置的值 ) ); 其中n為正整數 。
根據該公式我們分析一下b為什么后面會多兩個填充字節0。
b的最后一個成s偏移為8,大小為2,b中各成員對齊值最大的為4,因為未設置align(#),所以上取整的數值為4n。8+2按4的倍數上取整為12。因此后面需要填充兩個字節,這樣才能使sizeof(b) == 12。
下面以一代碼來說明align(#)指令的用法:
運行程序輸出32和64,按公式sizeof(structure) = (結構體最后一個成員的偏移 + sizeof(結構體最后一個成員) ) 上取整 ( n* max( 結構體各成員的對齊值,align(#)設置的值 ) )分析:
sizeof(S1) = (12+4) 上取整 ( n * max( 4, 32 ) )
sizeof(S1) = (16) 上取整 ( 32 )
sizeof(S1) = 32
S3的大小留待大家練練手。