解析C語言中的sizeof
一、sizeof的概念
sizeof是C語言的一種單目操作符,如C語言的其他操作符++、--等。它并不是函數(shù)。sizeof操作符以字節(jié)形式給出了其操作數(shù)的存儲(chǔ)大小。操作數(shù)可以是一個(gè)表達(dá)式或括在括號(hào)內(nèi)的類型名。操作數(shù)的存儲(chǔ)大小由操作數(shù)的類型決定。
二、sizeof的使用方法
1、用于數(shù)據(jù)類型
sizeof使用形式:sizeof(type)
數(shù)據(jù)類型必須用括號(hào)括住。如sizeof(int)。
2、用于變量
sizeof使用形式:sizeof(var_name)或sizeof var_name
變量名可以不用括號(hào)括住。如sizeof (var_name),sizeof var_name等都是正確形式。帶括號(hào)的用法更普遍,大多數(shù)程序員采用這種形式。
注意:sizeof操作符不能用于函數(shù)類型,不完全類型或位字段。不完全類型指具有未知存儲(chǔ)大小的數(shù)據(jù)類型,如未知存儲(chǔ)大小的數(shù)組類型、未知內(nèi)容的結(jié)構(gòu)或聯(lián)合類型、void類型等。
如sizeof(max)若此時(shí)變量max定義為int max(),sizeof(char_v) 若此時(shí)char_v定義為char char_v [MAX]且MAX未知,sizeof(void)都不是正確形式。
三、sizeof的結(jié)果
sizeof操作符的結(jié)果類型是size_t,它在頭文件
中typedef為unsigned int類型。該類型保證能容納實(shí)現(xiàn)所建立的最大對(duì)象的字節(jié)大小。
1、若操作數(shù)具有類型char、unsigned char或signed char,其結(jié)果等于1。
ANSI C正式規(guī)定字符類型為1字節(jié)。
2、int、unsigned int 、short int、unsigned short 、long int 、unsigned
long 、float、double、long double類型的sizeof 在ANSI C中沒有具體規(guī)定,大小依賴于實(shí)現(xiàn),一般可能分別為2、
2、2、2、4、4、4、8、10。
3、當(dāng)操作數(shù)是指針時(shí),sizeof依賴于編譯器。例如Microsoft C/C++7.0中,near類指針字節(jié)數(shù)為2,far、huge類指針字節(jié)數(shù)為4。一般Unix的指針字節(jié)數(shù)為4。
4、當(dāng)操作數(shù)具有數(shù)組類型時(shí),其結(jié)果是數(shù)組的總字節(jié)數(shù)。
5、聯(lián)合類型操作數(shù)的sizeof是其最大字節(jié)成員的字節(jié)數(shù)。結(jié)構(gòu)類型操作數(shù)的sizeof是這種類型對(duì)象的總字節(jié)數(shù),包括任何墊補(bǔ)在內(nèi)。
讓我們看如下結(jié)構(gòu):
struct {char b; double x;} a;
在某些機(jī)器上sizeof(a)=12,而一般sizeof(char)+ sizeof(double)=9。
這是因?yàn)榫幾g器在考慮對(duì)齊問題時(shí),在結(jié)構(gòu)中插入空位以控制各成員對(duì)象的地址對(duì)齊。如double類型的結(jié)構(gòu)成員x要放在被4整除的地址。
6、如果操作數(shù)是函數(shù)中的數(shù)組形參或函數(shù)類型的形參,sizeof給出其指針的大小。
四、sizeof與其他操作符的關(guān)系
sizeof的優(yōu)先級(jí)為2級(jí),比/、%等3級(jí)運(yùn)算符優(yōu)先級(jí)高。它可以與其他操作符一起組成表達(dá)式。如i*sizeof(int);其中i為int類型變量。
五、sizeof的主要用途
1、sizeof操作符的一個(gè)主要用途是與存儲(chǔ)分配和I/O系統(tǒng)那樣的例程進(jìn)行通信。例如:
void *malloc(size_t size),
size_t fread(void * ptr,size_t size,size_t nmemb,FILE * stream)。
2、sizeof的另一個(gè)的主要用途是計(jì)算數(shù)組中元素的個(gè)數(shù)。例如:
void * memset(void * s,int c,sizeof(s))。
六、建議
由于操作數(shù)的字節(jié)數(shù)在實(shí)現(xiàn)時(shí)可能出現(xiàn)變化,建議在涉及到操作數(shù)字節(jié)大小時(shí)用sizeof來代替常量計(jì)算。
------------------------------------------------------------------
本文主要包括二個(gè)部分,第一部分重點(diǎn)介紹在VC中,怎么樣采用sizeof來求結(jié)構(gòu)的大小,以及容易出現(xiàn)的問題,并給出解決問題的方法,第二部分總結(jié)出VC中sizeof的主要用法。
1、 sizeof應(yīng)用在結(jié)構(gòu)上的情況
請(qǐng)看下面的結(jié)構(gòu):
struct MyStruct
{
double dda1;
char dda;
int type
};
對(duì)結(jié)構(gòu)MyStruct采用sizeof會(huì)出現(xiàn)什么結(jié)果呢?sizeof(MyStruct)為多少呢?也許你會(huì)這樣求:
sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13
但是當(dāng)在VC中測(cè)試上面結(jié)構(gòu)的大小時(shí),你會(huì)發(fā)現(xiàn)sizeof(MyStruct)為16。你知道為什么在VC中會(huì)得出這樣一個(gè)結(jié)果嗎?
其實(shí),這是VC對(duì)變量存儲(chǔ)的一個(gè)特殊處理。為了提高CPU的存儲(chǔ)速度,VC對(duì)一些變量的起始地址做了“對(duì)齊”處理。在默認(rèn)情況下,VC規(guī)定各成
員變量存放的起始地址相對(duì)于結(jié)構(gòu)的起始地址的偏移量必須為該變量的類型所占用的字節(jié)數(shù)的倍數(shù)。下面列出常用類型的對(duì)齊方式(vc6.0,32位系統(tǒng))。
類型
對(duì)齊方式(變量存放的起始地址相對(duì)于結(jié)構(gòu)的起始地址的偏移量)
Char
偏移量必須為sizeof(char)即1的倍數(shù)
int
偏移量必須為sizeof(int)即4的倍數(shù)
float
偏移量必須為sizeof(float)即4的倍數(shù)
double
偏移量必須為sizeof(double)即8的倍數(shù)
Short
偏移量必須為sizeof(short)即2的倍數(shù)
?
各成員變量在存放的時(shí)候根據(jù)在結(jié)構(gòu)中出現(xiàn)的順序依次申請(qǐng)空間,同時(shí)按照上面的對(duì)齊方式調(diào)整位置,空缺的字節(jié)VC會(huì)自動(dòng)填充。同時(shí)VC為了確保結(jié)
構(gòu)的大小為結(jié)構(gòu)的字節(jié)邊界數(shù)(即該結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù))的倍數(shù),所以在為最后一個(gè)成員變量申請(qǐng)空間后,還會(huì)根據(jù)需要自動(dòng)填充空缺的字
節(jié)。
下面用前面的例子來說明VC到底怎么樣來存放結(jié)構(gòu)的。
struct MyStruct
{
double dda1;
char dda;
int type
};
為上面的結(jié)構(gòu)分配空間的時(shí)候,VC根據(jù)成員變量出現(xiàn)的順序和對(duì)齊方式,先為第一個(gè)成員dda1分配空間,其起始地址跟結(jié)構(gòu)的起始地址相同(剛好
偏移量0剛好為sizeof(double)的倍數(shù)),該成員變量占用sizeof(double)=8個(gè)字節(jié);接下來為第二個(gè)成員dda分配空間,這時(shí)
下一個(gè)可以分配的地址對(duì)于結(jié)構(gòu)的起始地址的偏移量為8,是sizeof(char)的倍數(shù),所以把dda存放在偏移量為8的地方滿足對(duì)齊方式,該成員變量
占用sizeof(char)=1個(gè)字節(jié);接下來為第三個(gè)成員type分配空間,這時(shí)下一個(gè)可以分配的地址對(duì)于結(jié)構(gòu)的起始地址的偏移量為9,不是
sizeof(int)=4的倍數(shù),為了滿足對(duì)齊方式對(duì)偏移量的約束問題,VC自動(dòng)填充3個(gè)字節(jié)(這三個(gè)字節(jié)沒有放什么東西),這時(shí)下一個(gè)可以分配的地址
對(duì)于結(jié)構(gòu)的起始地址的偏移量為12,剛好是sizeof(int)=4的倍數(shù),所以把type存放在偏移量為12的地方,該成員變量占用sizeof
(int)=4個(gè)字節(jié);這時(shí)整個(gè)結(jié)構(gòu)的成員變量已經(jīng)都分配了空間,總的占用的空間大小為:8+1+3+4=16,剛好為結(jié)構(gòu)的字節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最
大空間的類型所占用的字節(jié)數(shù)sizeof(double)=8)的倍數(shù),所以沒有空缺的字節(jié)需要填充。所以整個(gè)結(jié)構(gòu)的大小為:sizeof
(MyStruct)=8+1+3+4=16,其中有3個(gè)字節(jié)是VC自動(dòng)填充的,沒有放任何有意義的東西。
下面再舉個(gè)例子,交換一下上面的MyStruct的成員變量的位置,使它變成下面的情況:
struct MyStruct
{
char dda;
double dda1;
int type
};
這個(gè)結(jié)構(gòu)占用的空間為多大呢?在VC6.0環(huán)境下,可以得到sizeof(MyStruc)為24。結(jié)合上面提到的分配空間的一些原則,分析下VC怎么樣為上面的結(jié)構(gòu)分配空間的。(簡(jiǎn)單說明)
struct MyStruct
{
char dda;//偏移量為0,滿足對(duì)齊方式,dda占用1個(gè)字節(jié);
double dda1;//下一個(gè)可用的地址的偏移量為1,不是sizeof(double)=8
//的倍數(shù),需要補(bǔ)足7個(gè)字節(jié)才能使偏移量變?yōu)?(滿足對(duì)齊
//方式),因此VC自動(dòng)填充7個(gè)字節(jié),dda1存放在偏移量為8
//的地址上,它占用8個(gè)字節(jié)。
int type;//下一個(gè)可用的地址的偏移量為16,是sizeof(int)=4的倍
//數(shù),滿足int的對(duì)齊方式,所以不需要VC自動(dòng)填充,type存
//放在偏移量為16的地址上,它占用4個(gè)字節(jié)。
};//所有成員變量都分配了空間,空間總的大小為1+7+8+4=20,不是結(jié)構(gòu)
//的節(jié)邊界數(shù)(即結(jié)構(gòu)中占用最大空間的類型所占用的字節(jié)數(shù)sizeof
//(double)=8)的倍數(shù),所以需要填充4個(gè)字節(jié),以滿足結(jié)構(gòu)的大小為
//sizeof(double)=8的倍數(shù)。
?
所以該結(jié)構(gòu)總的大小為:sizeof(MyStruc)為1+7+8+4+4=24。其中總的有7+4=11個(gè)字節(jié)是VC自動(dòng)填充的,沒有放任何有意義的東西。
?
VC對(duì)結(jié)構(gòu)的存儲(chǔ)的特殊處理確實(shí)提高CPU存儲(chǔ)變量的速度,但是有時(shí)候也帶來了一些麻煩,我們也屏蔽掉變量默認(rèn)的對(duì)齊方式,自己可以設(shè)定變量的對(duì)齊方式。
VC中提供了#pragma
pack(n)來設(shè)定變量以n字節(jié)對(duì)齊方式。n字節(jié)對(duì)齊就是說變量存放的起始地址的偏移量有兩種情況:第一、如果n大于等于該變量所占用的字節(jié)數(shù),那么偏
移量必須滿足默認(rèn)的對(duì)齊方式,第二、如果n小于該變量的類型所占用的字節(jié)數(shù),那么偏移量為n的倍數(shù),不用滿足默認(rèn)的對(duì)齊方式。結(jié)構(gòu)的總大小也有個(gè)約束條
件,分下面兩種情況:如果n大于所有成員變量類型所占用的字節(jié)數(shù),那么結(jié)構(gòu)的總大小必須為占用空間最大的變量占用的空間數(shù)的倍數(shù);
否則必須為n的倍數(shù)。下面舉例說明其用法。
#pragma pack(push) //保存對(duì)齊狀態(tài)
#pragma pack(4)//設(shè)定為4字節(jié)對(duì)齊
struct test
{
char m1;
double m4;
int m3;
};
#pragma pack(pop)//恢復(fù)對(duì)齊狀態(tài)
以上結(jié)構(gòu)的大小為16,下面分析其存儲(chǔ)情況,首先為m1分配空間,其偏移量為0,滿足我們自己設(shè)定的對(duì)齊方式(4字節(jié)對(duì)齊),m1占用1個(gè)字
節(jié)。接著開始為m4分配空間,這時(shí)其偏移量為1,需要補(bǔ)足3個(gè)字節(jié),這樣使偏移量滿足為n=4的倍數(shù)(因?yàn)閟izeof(double)大于n),m4占
用8個(gè)字節(jié)。接著為m3分配空間,這時(shí)其偏移量為12,滿足為4的倍數(shù),m3占用4個(gè)字節(jié)。這時(shí)已經(jīng)為所有成員變量分配了空間,共分配了16個(gè)字節(jié),滿足
為n的倍數(shù)。如果把上面的#pragma pack(4)改為#pragma
pack(16),那么我們可以得到結(jié)構(gòu)的大小為24。(請(qǐng)讀者自己分析)
2、 sizeof用法總結(jié)
在VC中,sizeof有著許多的用法,而且很容易引起一些錯(cuò)誤。下面根據(jù)sizeof后面的參數(shù)對(duì)sizeof的用法做個(gè)總結(jié)。
A. 參數(shù)為數(shù)據(jù)類型或者為一般變量。例如sizeof(int),sizeof(long)等等。這種情況要注意的是不同系統(tǒng)系統(tǒng)或者不同編譯器得到的結(jié)果可能是不同的。例如int類型在16位系統(tǒng)中占2個(gè)字節(jié),在32位系統(tǒng)中占4個(gè)字節(jié)。
B. 參數(shù)為數(shù)組或指針。下面舉例說明.
int a[50]; //sizeof(a)=4*50=200; 求數(shù)組所占的空間大小
int *a=new int[50];// sizeof(a)=4; a為一個(gè)指針,sizeof(a)是求指針
//的大小,在32位系統(tǒng)中,當(dāng)然是占4個(gè)字節(jié)。
C. 參數(shù)為結(jié)構(gòu)或類。Sizeof應(yīng)用在類和結(jié)構(gòu)的處理情況是相同的。但有兩點(diǎn)需要注意,第一、結(jié)構(gòu)或者類中的靜態(tài)成員不對(duì)結(jié)構(gòu)或者類的大小產(chǎn)生影響,因?yàn)殪o態(tài)變量的存儲(chǔ)位置與結(jié)構(gòu)或者類的實(shí)例地址無關(guān)。
第二、沒有成員變量的結(jié)構(gòu)或類的大小為1,因?yàn)楸仨毐WC結(jié)構(gòu)或類的每一
個(gè)實(shí)例在內(nèi)存中都有唯一的地址。
下面舉例說明,
Class Test{int a;static double c};//sizeof(Test)=4.
Test *s;//sizeof(s)=4,s為一個(gè)指針。
Class test1{ };//sizeof(test1)=1;
D. 參數(shù)為其他。下面舉例說明。
int func(char s[5]);
{
cout<
//數(shù)的參數(shù)在傳遞的時(shí)候系統(tǒng)處理為一個(gè)指針,所
//以sizeof(s)實(shí)際上為求指針的大小。
return 1;
}
sizeof(func(“1234”))=4//因?yàn)閒unc的返回類型為int,所以相當(dāng)于
//求sizeof(int).
?
以上為sizeof的基本用法,在實(shí)際的使用中要注意分析VC的分配變量的分配策略,這樣的話可以避免一些錯(cuò)誤。
-------------------------------------------------------------------
sizeof詳解
1、什么是sizeof
??? 首先看一下sizeof在msdn上的定義:
??? The sizeof keyword gives the amount of storage, in bytes,
associated with a variable or a type (including aggregate types). This
keyword returns a value of type size_t.
???
看到return這個(gè)字眼,是不是想到了函數(shù)?錯(cuò)了,sizeof不是一個(gè)函數(shù),你見過給一個(gè)函數(shù)傳參數(shù),而不加括號(hào)的嗎?sizeof可以,所以
sizeof不是函數(shù)。網(wǎng)上有人說sizeof是一元操作符,但是我并不這么認(rèn)為,因?yàn)閟izeof更像一個(gè)特殊的宏,它是在編譯階段求值的。舉個(gè)例子:
cout<<sizeof(int)<<endl; // 32位機(jī)上int長(zhǎng)度為4
cout<<sizeof(1==2)<<endl; // == 操作符返回bool類型,相當(dāng)于 cout<<sizeof(bool)<<endl;
??? 在編譯階段已經(jīng)被翻譯為:
cout<<4<<endl;
cout<<1<<endl;
??? 這里有個(gè)陷阱,看下面的程序:
int a = 0;
cout<<sizeof(a=3)<<endl;
cout<<a<<endl;
???
輸出為什么是4,0而不是期望中的4,3???就在于sizeof在編譯階段處理的特性。由于sizeof不能被編譯成機(jī)器碼,所以sizeof作用范圍
內(nèi),也就是()里面的內(nèi)容也不能被編譯,而是被替換成類型。=操作符返回左操作數(shù)的類型,所以a=3相當(dāng)于int,而代碼也被替換為:
int a = 0;
cout<<4<<endl;
cout<<a<<endl;
??? 所以,sizeof是不可能支持鏈?zhǔn)奖磉_(dá)式的,這也是和一元操作符不一樣的地方。
??? 結(jié)論:不要把sizeof當(dāng)成函數(shù),也不要看作一元操作符,把他當(dāng)成一個(gè)特殊的編譯預(yù)處理。
2、sizeof的用法
??? sizeof有兩種用法:
?
??? (1)sizeof(object)
??? 也就是對(duì)對(duì)象使用sizeof,也可以寫成sizeof object 的形式。例如:
??? (2)sizeof(typename)
??? 也就是對(duì)類型使用sizeof,注意這種情況下寫成sizeof typename是非法的。下面舉幾個(gè)例子說明一下:
int i = 2;
cout<<sizeof(i)<<endl; // sizeof(object)的用法,合理
cout<<sizeof i<<endl; // sizeof object的用法,合理
cout<<sizeof 2<<endl; // 2被解析成int類型的object, sizeof object的用法,合理
cout<<sizeof(2)<<endl; // 2被解析成int類型的object, sizeof(object)的用法,合理
cout<<sizeof(int)<<endl;// sizeof(typename)的用法,合理
cout<<sizeof int<<endl; // 錯(cuò)誤!對(duì)于操作符,一定要加()
??? 可以看出,加()是永遠(yuǎn)正確的選擇。
??? 結(jié)論:不論sizeof要對(duì)誰取值,最好都加上()。
3、數(shù)據(jù)類型的sizeof
(1)C++固有數(shù)據(jù)類型
??? 32位C++中的基本數(shù)據(jù)類型,也就char,short int(short),int,long int(long),float,double, long double
大小分別是:1,2,4,4,4,8, 10。
??? 考慮下面的代碼:
cout<<sizeof(unsigned int) == sizeof(int)<<endl; // 相等,輸出 1
??? unsigned影響的只是最高位bit的意義,數(shù)據(jù)長(zhǎng)度不會(huì)被改變的。
??? 結(jié)論:unsigned不能影響sizeof的取值。
(2)自定義數(shù)據(jù)類型
??? typedef可以用來定義C++自定義類型。考慮下面的問題:
typedef short WORD;
typedef long DWORD;
cout<<(sizeof(short) == sizeof(WORD))<<endl; // 相等,輸出1
cout<<(sizeof(long) == sizeof(DWORD))<<endl; // 相等,輸出1
??? 結(jié)論:自定義類型的sizeof取值等同于它的類型原形。
(3)函數(shù)類型
??? 考慮下面的問題:
int f1(){return 0;};
double f2(){return 0.0;}
void f3(){}
cout<<sizeof(f1())<<endl; // f1()返回值為int,因此被認(rèn)為是int
cout<<sizeof(f2())<<endl; // f2()返回值為double,因此被認(rèn)為是double
cout<<sizeof(f3())<<endl; // 錯(cuò)誤!無法對(duì)void類型使用sizeof
cout<<sizeof(f1)<<endl;? // 錯(cuò)誤!無法對(duì)函數(shù)指針使用sizeof??
cout<<sizeof*f2<<endl;? // *f2,和f2()等價(jià),因?yàn)榭梢钥醋鱫bject,所以括號(hào)不是必要的。被認(rèn)為是double
??? 結(jié)論:對(duì)函數(shù)使用sizeof,在編譯階段會(huì)被函數(shù)返回值的類型取代,
4、指針問題
??? 考慮下面問題:
cout<<sizeof(string*)<<endl; // 4
cout<<sizeof(int*)<<endl; // 4
cout<<sizof(char****)<<endl; // 4
??? 可以看到,不管是什么類型的指針,大小都是4的,因?yàn)橹羔樉褪?2位的物理地址。
??? 結(jié)論:只要是指針,大小就是4。(64位機(jī)上要變成8也不一定)。
???
順便唧唧歪歪幾句,C++中的指針表示實(shí)際內(nèi)存的地址。和C不一樣的是,C++中取消了模式之分,也就是不再有small,middle,big,取而代
之的是統(tǒng)一的flat。flat模式采用32位實(shí)地址尋址,而不再是c中的 segment:offset模式。舉個(gè)例子,假如有一個(gè)指向地址
f000:8888的指針,如果是C類型則是8888(16位,
只存儲(chǔ)位移,省略段),far類型的C指針是f0008888(32位,高位保留段地址,地位保留位移),C++類型的指針是f8888(32位,相當(dāng)于
段地址*16 + 位移,但尋址范圍要更大)。
5、數(shù)組問題
??? 考慮下面問題:
char a[] = "abcdef";
int b[20] = {3, 4};
char c[2][3] = {"aa", "bb"};
cout<<sizeof(a)<<endl; // 7
cout<<sizeof(b)<<endl; // 20
cout<<sizeof(c)<<endl; // 6
??? 數(shù)組a的大小在定義時(shí)未指定,編譯時(shí)給它分配的空間是按照初始化的值確定的,也就是7。c是多維數(shù)組,占用的空間大小是各維數(shù)的乘積,也就是6。可以看出,數(shù)組的大小就是他在編譯時(shí)被分配的空間,也就是各維數(shù)的乘積*數(shù)組元素的大小。
??? 結(jié)論:數(shù)組的大小是各維數(shù)的乘積*數(shù)組元素的大小。
??? 這里有一個(gè)陷阱:
int *d = new int[10];
cout<<sizeof(d)<<endl; // 4
??? d是我們常說的動(dòng)態(tài)數(shù)組,但是他實(shí)質(zhì)上還是一個(gè)指針,所以sizeof(d)的值是4。
??? 再考慮下面的問題:
double* (*a)[3][6];
cout<<sizeof(a)<<endl;? // 4
cout<<sizeof(*a)<<endl;? // 72
cout<<sizeof(**a)<<endl; // 24
cout<<sizeof(***a)<<endl; // 4
cout<<sizeof(****a)<<endl; // 8
??? a是一個(gè)很奇怪的定義,他表示一個(gè)指向 double*[3][6]類型數(shù)組的指針。既然是指針,所以sizeof(a)就是4。
???
既然a是執(zhí)行double*[3][6]類型的指針,*a就表示一個(gè)double*[3][6]的多維數(shù)組類型,因此sizeof(*a)=
3*6*sizeof(double*)=72。同樣的,**a表示一個(gè)double*[6]類型的數(shù)組,所以sizeof(**a)=6*sizeof
(double*)=24。***a就表示其中的一個(gè)元素,也就是double*了,所以sizeof(***a)=4。至于****a,就是一個(gè)
double了,所以sizeof(****a)=sizeof(double)=8。
6、向函數(shù)傳遞數(shù)組的問題。
??? 考慮下面的問題:
#include <iostream>
using namespace std;
int Sum(int i[])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++) //實(shí)際上,sizeof(i) = 4
{
? sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[6] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}
??? Sum的本意是用sizeof得到數(shù)組的大小,然后求和。但是實(shí)際上,傳入自函數(shù)Sum的,只是一個(gè)int 類型的指針,所以sizeof(i)=4,而不是24,所以會(huì)產(chǎn)生錯(cuò)誤的結(jié)果。解決這個(gè)問題的方法使是用指針或者引用。
??? 使用指針的情況:
int Sum(int (*i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(*i)/sizeof(int); j++) //sizeof(*i) = 24
{
? sumofi += (*i)[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(&allAges)<<endl;
system("pause");
return 0;
}
???
在這個(gè)Sum里,i是一個(gè)指向i[6]類型的指針,注意,這里不能用int Sum(int
(*i)[])聲明函數(shù),而是必須指明要傳入的數(shù)組的大小,不然sizeof(*i)無法計(jì)算。但是在這種情況下,再通過sizeof來計(jì)算數(shù)組大小已經(jīng)
沒有意義了,因?yàn)榇藭r(shí)大小是指定為6的。
使用引用的情況和指針相似:
int Sum(int (&i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++)
{
? sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}
??? 這種情況下sizeof的計(jì)算同樣無意義,所以用數(shù)組做參數(shù),而且需要遍歷的時(shí)候,函數(shù)應(yīng)該有一個(gè)參數(shù)來說明數(shù)組的大小,而數(shù)組的大小在數(shù)組定義的作用域內(nèi)通過sizeof求值。因此上面的函數(shù)正確形式應(yīng)該是:
#include <iostream>
using namespace std;
int Sum(int *i, unsigned int n)
{
int sumofi = 0;
for (int j = 0; j < n; j++)
{
? sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(i, sizeof(allAges)/sizeof(int))<<endl;
system("pause");
return 0;
}
7、字符串的sizeof和strlen
??? 考慮下面的問題:
char a[] = "abcdef";
char b[20] = "abcdef";
string s = "abcdef";
cout<<strlen(a)<<endl;? // 6,字符串長(zhǎng)度
cout<<sizeof(a)<<endl;? // 7,字符串容量
cout<<strlen(b)<<endl;? // 6,字符串長(zhǎng)度
cout<<strlen(b)<<endl;? // 20,字符串容量
cout<<sizeof(s)<<endl;? // 12, 這里不代表字符串的長(zhǎng)度,而是string類的大小
cout<<strlen(s)<<endl;? // 錯(cuò)誤!s不是一個(gè)字符指針。
a[1] = '\0';
cout<<strlen(a)<<endl;? // 1
cout<<sizeof(a)<<endl;? // 7,sizeof是恒定的
???
strlen是尋找從指定地址開始,到出現(xiàn)的第一個(gè)0之間的字符個(gè)數(shù),他是在運(yùn)行階段執(zhí)行的,而sizeof是得到數(shù)據(jù)的大小,在這里是得到字符串的容
量。所以對(duì)同一個(gè)對(duì)象而言,sizeof的值是恒定的。string是C++類型的字符串,他是一個(gè)類,所以sizeof(s)表示的并不是字符串的長(zhǎng)
度,而是類string的大小。strlen(s)根本就是錯(cuò)誤的,因?yàn)閟trlen的參數(shù)是一個(gè)字符指針,如果想用strlen得到s字符串的長(zhǎng)度,應(yīng)
該使用sizeof(s.c_str()),因?yàn)閟tring的成員函數(shù)c_str()返回的是字符串的首地址。實(shí)際上,string類提供了自己的成員
函數(shù)來得到字符串的容量和長(zhǎng)度,分別是Capacity()和Length()。string封裝了常用了字符串操作,所以在C++開發(fā)過程中,最好使用
string代替C類型的字符串。
8、從union的sizeof問題看cpu的對(duì)界
??? 考慮下面問題:(默認(rèn)對(duì)齊方式)
union u
{
? double a;
? int b;
};
union u2
{
? char a[13];
? int b;
};
union u3
{
? char a[13];
? char b;
};
cout<<sizeof(u)<<endl;? // 8
cout<<sizeof(u2)<<endl;? // 16
cout<<sizeof(u3)<<endl;? // 13
???
都知道union的大小取決于它所有的成員中,占用空間最大的一個(gè)成員的大小。所以對(duì)于u來說,大小就是最大的double類型成員a了,所以
sizeof(u)=sizeof(double)=8。但是對(duì)于u2和u3,最大的空間都是char[13]類型的數(shù)組,為什么u3的大小是13,而
u2是16呢?關(guān)鍵在于u2中的成員int
b。由于int類型成員的存在,使u2的對(duì)齊方式變成4,也就是說,u2的大小必須在4的對(duì)界上,所以占用的空間變成了16(最接近13的對(duì)界)。
??? 結(jié)論:復(fù)合數(shù)據(jù)類型,如union,struct,class的對(duì)齊方式為成員中對(duì)齊方式最大的成員的對(duì)齊方式。
???
順便提一下CPU對(duì)界問題,32的C++采用8位對(duì)界來提高運(yùn)行速度,所以編譯器會(huì)盡量把數(shù)據(jù)放在它的對(duì)界上以提高內(nèi)存命中率。對(duì)界是可以更改的,使用
#pragma
pack(x)宏可以改變編譯器的對(duì)界方式,默認(rèn)是8。C++固有類型的對(duì)界取編譯器對(duì)界方式與自身大小中較小的一個(gè)。例如,指定編譯器按2對(duì)界,int
類型的大小是4,則int的對(duì)界為2和4中較小的2。在默認(rèn)的對(duì)界方式下,因?yàn)閹缀跛械臄?shù)據(jù)類型都不大于默認(rèn)的對(duì)界方式8(除了long
double),所以所有的固有類型的對(duì)界方式可以認(rèn)為就是類型自身的大小。更改一下上面的程序:
#pragma pack(2)
union u2
{
? char a[13];
? int b;
};
union u3
{
? char a[13];
? char b;
};
#pragma pack(8)
cout<<sizeof(u2)<<endl;? // 14
cout<<sizeof(u3)<<endl;? // 13
??? 由于手動(dòng)更改對(duì)界方式為2,所以int的對(duì)界也變成了2,u2的對(duì)界取成員中最大的對(duì)界,也是2了,所以此時(shí)sizeof(u2)=14。
??? 結(jié)論:C++固有類型的對(duì)界取編譯器對(duì)界方式與自身大小中較小的一個(gè)。
9、struct的sizeof問題
??? 因?yàn)閷?duì)齊問題使結(jié)構(gòu)體的sizeof變得比較復(fù)雜,看下面的例子:(默認(rèn)對(duì)齊方式下)
struct s1
{
? char a;
? double b;
? int c;
? char d;
};
struct s2
{
? char a;
? char b;
? int c;
? double d;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16
???
同樣是兩個(gè)char類型,一個(gè)int類型,一個(gè)double類型,但是因?yàn)閷?duì)界問題,導(dǎo)致他們的大小不同。計(jì)算結(jié)構(gòu)體大小可以采用元素?cái)[放法,我舉例子說
明一下:首先,CPU判斷結(jié)構(gòu)體的對(duì)界,根據(jù)上一節(jié)的結(jié)論,s1和s2的對(duì)界都取最大的元素類型,也就是double類型的對(duì)界8。然后開始擺放每個(gè)元
素。
???
對(duì)于s1,首先把a(bǔ)放到8的對(duì)界,假定是0,此時(shí)下一個(gè)空閑的地址是1,但是下一個(gè)元素d是double類型,要放到8的對(duì)界上,離1最接近的地址是8
了,所以d被放在了8,此時(shí)下一個(gè)空閑地址變成了16,下一個(gè)元素c的對(duì)界是4,16可以滿足,所以c放在了16,此時(shí)下一個(gè)空閑地址變成了20,下一個(gè)
元素d需要對(duì)界1,也正好落在對(duì)界上,所以d放在了20,結(jié)構(gòu)體在地址21處結(jié)束。由于s1的大小需要是8的倍數(shù),所以21-23的空間被保留,s1的大
小變成了24。
???
對(duì)于s2,首先把a(bǔ)放到8的對(duì)界,假定是0,此時(shí)下一個(gè)空閑地址是1,下一個(gè)元素的對(duì)界也是1,所以b擺放在1,下一個(gè)空閑地址變成了2;下一個(gè)元素c的
對(duì)界是4,所以取離2最近的地址4擺放c,下一個(gè)空閑地址變成了8,下一個(gè)元素d的對(duì)界是8,所以d擺放在8,所有元素?cái)[放完畢,結(jié)構(gòu)體在15處結(jié)束,占
用總空間為16,正好是8的倍數(shù)。
??? 這里有個(gè)陷阱,對(duì)于結(jié)構(gòu)體中的結(jié)構(gòu)體成員,不要認(rèn)為它的對(duì)齊方式就是他的大小,看下面的例子:
struct s1
{
? char a[8];
};
struct s2
{
? double d;
};
struct s3
{
? s1 s;
? char a;
};
struct s4
{
? s2 s;
? char a;
};
cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;
??? s1和s2大小雖然都是8,但是s1的對(duì)齊方式是1,s2是8(double),所以在s3和s4中才有這樣的差異。
??? 所以,在自己定義結(jié)構(gòu)體的時(shí)候,如果空間緊張的話,最好考慮對(duì)齊因素來排列結(jié)構(gòu)體里的元素。
10、不要讓double干擾你的位域
??? 在結(jié)構(gòu)體和類中,可以使用位域來規(guī)定某個(gè)成員所能占用的空間,所以使用位域能在一定程度上節(jié)省結(jié)構(gòu)體占用的空間。不過考慮下面的代碼:
struct s1
{
? int i: 8;
? int j: 4;
? double b;
? int a:3;
};
struct s2
{
? int i;
? int j;
? double b;
? int a;
};
struct s3
{
? int i;
? int j;
? int a;
? double b;
};
struct s4
{
? int i: 8;
? int j: 4;
? int a:3;
? double b;
};
cout<<sizeof(s1)<<endl;? // 24
cout<<sizeof(s2)<<endl;? // 24
cout<<sizeof(s3)<<endl;? // 24
cout<<sizeof(s4)<<endl;? // 16
??? 可以看到,有double存在會(huì)干涉到位域(sizeof的算法參考上一節(jié)),所以使用位域的的時(shí)候,最好把float類型和double類型放在程序的開始或者最后。