在上面講到了關于pack的內存對齊和計算方法,這里繼續講實現內存對齊的另一種方式:__declspec( align(#) )
__declspec( align(#) )和#pragma pack( n )有密切聯系。
當一個變量或結構體同時受兩者影響時,前者的優先級高。
成員的地址決定于前者及后者,其要么是前者的倍數,要么是后者的倍數,要么是成員的大小的倍數,取最小。
結構體最后的大小于前者有關,其要么是前者的倍數,要么是結構體中最大偏移量的倍數,取最大。
要算出最后結果,必須知道兩者的值或缺省值。
下面舉一個例子來詳細的分析:
#include <stdio.h>
#include "stdafx.h"
#include <stdlib.h>
//using namespace std;
#pragma pack( push, 4 )
__declspec( align(32) )struct D
{
int i1;
double d1;
int i2;
int i3;
};
int main()
{
cout << "sizeof(int) = "<<sizeof(int) << endl;
cout << "sizeof(char) = " << sizeof(char) << endl;
cout << "sizeof(double) = " << sizeof(double) << endl;
cout << sizeof(D) << endl;
system("PAUSE");
return 0;
}
這段代碼在VS 2010中的運行結果是,sizeof(D)的大小為32,而在Dev C++,C-Free 5.0以及gcc中的結果都似乎20。下面我們來著重講講關于__declspec( align(#) )的用法:
正如前面所說的,當有__declspec( align(#) )和pack的時候,__declspec( align(#) )的優先級要高些。所以對于上面這個例子,我們首先來計算出來每一個的大小。
1. 成員的地址如何取?
規則:成員的地址要取pack(n),__declspec( align(m) ),以及成員自身大小這三者之間的最小值,也就是,min(n,m,sizeof(成員變量類型)),那么我們可以對每一個結構體的成員都進行分析。
第一個為int類型,占據4B,所以地址是[0~3].
第二個為double類型,它的地址要根據min(4,32,sizeof(double))來判斷,所以應該是4的倍數,也就是相鄰著int類型的i1存放。地址是[4~11]。
第三個為int類型,占據4B,同樣應該是4的倍數,地址是[12~15].
第四個為int類型,占據4B,地址為[16~19].
從而總的地址是從[0~19]連續存放的20個字節,那么是否sizeof(D)的大小就是20呢?
經過測試,我們可以看到,在VS 2010中,結果是32,why?
這就要用__declspec( align(#) )來解釋了。也就是下面第二點的內容。
2. 結構體最后的大小如何決定?
規則:結構體最后的大小與__declspec( align(m) )有關,其要么是它的倍數,要么是結構體中最大偏移量的倍數,取最大。
根據這個規則,這里align是32,而結構體中最大的是double類型,也就是應該是max(32,8)=32,所以最后結構體的大小應該是32的倍數,而明顯上面我們看到的實際大小是20B,從而需要擴展到32B。
在這里,就體現了__declspec( align(m) )的強大作用!
同樣的,為了體現該語句的作用,我們去掉這個語句,運用我們前面一節內容的知識,來計算并測試sizeof(D),最終不論是在VS 2010還是Dev C++中,運行的結果都是上面我們所預測的20B。
OK,下面回到最后的疑問,也就是前面我們提出的,為何加入了__declspec( align(m) )語句之后,在DevC++和VS 2010的結果不同?
實際上,對于這些內存對齊的處理,不同的編譯器可能采取不同的處理,就像前面一節中所說的,我將pack誤用為package,導致根本沒有達到按照我要求的字節對齊的目的,而且編譯器根本不提供任何警告信息。那么,這里合理的解釋是:Dev C++不支持這種用法。
通過查閱資料,參照這篇文章【 SSE指令介紹及其C、C++應用 】(http://blog.csdn.net/delphihero/archive/2006/09/24/1270069.aspx),我們可以看到作者有這么一段話:
“接下來我舉一個例子來說明SSE的指令函數是如何使用的,必須要說明的是我以下的代碼都是在VC7.1的平臺上寫的,不保證對其它如Dev-C++、Borland C++等開發平臺的完全兼容。”
“這里要注意一下,我使用了__declspec(align(16))做為數組定義的修釋符,這表示該數組是以16字節為邊界對齊的,因為SSE指令只能支持這種格式的內存數據。
我們在這里看到了SSE算的強大,相信它會成為多媒體程序員手中用來對付無窮盡流媒體數據的一把利劍。我后面還會寫一些關于SSE算法更復雜應用的文章,敬請關注,感謝您抽時間閱讀!
”
從這篇文章我們可以看到,SSE指令集的情況下,在VC 7.1下才支持__declspec(align(16))這種用法,而對于其他平臺不一定有效。而前面我們使用的Dev C++以及C-Free,都是基于g++或者MinGW,不一定會支持這種方式,或者說,不一定按照這種內存對齊的建議來做,也就造成了結果的不同。
下面我們來繼續探討結構體中有結構體的情況。
先看看下面這段代碼:
#include <stdio.h>
#include "stdafx.h"
#include <stdlib.h>
//using namespace std;
#pragma pack( push, 4 )
__declspec( align(32) )struct D
{
int i1;
double d1;
int i2;
int i3;
};
__declspec( align(16) ) struct E
{
int i1;
D m_d;
int i2;
};
int main()
{
cout << "sizeof(int) = "<<sizeof(int) << endl;
cout << "sizeof(char) = " << sizeof(char) << endl;
cout << "sizeof(double) = " << sizeof(double) << endl;
cout << sizeof(D) << endl;
cout << sizeof(E) << endl;
system("PAUSE");
return 0;
}
最后運行的結果是sizeof(E)為96,為何會是這個結果呢?我們來詳細講解下。
對于結構體E,第一個元素為int類型,所以占據[0~3]地址單元。
第二個元素是一個結構體,該結構體由于受上面__declspec( align(32) )的影響,優先級高,所以起始地址是32的倍數,而且大小為32B,從而應該放置在[32~63]單元處。
最后一個是int類型的變量,大小為4,所以應該是4的倍數,地址為[64~67]。
故結構體E的大小應該是從[0~67],占據68B,而由于前面還有限制__declspec( align(16) ),同時成員變量的最大偏移是sizeof(D)=32,所以我們最后這個結構體的大小應該是他們中最大值的倍數,也就是32的倍數,68向上取32的倍數應該是96.故結果為96.
最后仍然是上面平臺的問題,在Dev C++和G++下面的結果不同,原因上面解釋了。
MSDN:
“The sizeof value for any structure is the offset of the final member, plus that member's size, rounded up to the nearest multiple of the largest member alignment value or the whole structure alignment value, whichever is greater.”
中文:
“sizeof的結果都是結構體中最后的一個成員變量加上它的大小,再加上一個填充容量(padding),這個填充大小是成員變量最大的一個對齊參數或整個結構體的對齊參數的倍數,取哪個決定于哪個對齊參數較大”
ms-help://MS.VSCC.v90/MS.MSDNQTR.v90.en/dv_vclang/html/e4209cbb-5437-4b53-b3fe-ac264501d404.htm
ms-help://MS.VSCC.v90/MS.MSDNQTR.v90.en/dv_vclang/html/9cb63f58-658b-4425-ac47-af8eabfc5878.htm
P.S.:上面是關于內存對齊的研究,如有謬誤,歡迎指出!
附參考資料和拓展:
1. #pragma pack :http://blog.sina.com.cn/s/blog_492aa57901008y3h.html
2. #pragma pack( n )和__declspec( align(#) ) 的偏移量計算方法: http://blog.csdn.net/whoismickey/archive/2009/03/28/4032155.aspx
3. #pragma pack(push,1) (pop) :http://blog.csdn.net/jiang1013nan/archive/2009/11/25/4861248.aspx
4. 關于pragma pack的用法(四) C++中的內存對齊問題: http://www.shnenglu.com/xczhang/archive/2007/12/23/39396.html
5. SSE指令介紹及其C、C++應用:http://blog.csdn.net/delphihero/archive/2006/09/24/1270069.aspx
6. c++中__declspec用法總結: http://sealbird.javaeye.com/blog/855096
posted on 2011-03-13 22:30
deercoder 閱讀(9990)
評論(5) 編輯 收藏 引用 所屬分類:
C++