1
、什么是
sizeof
?
首先看一下
sizeof
在
msdn
上的定義:
? The sizeof keyword gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value of type size_t.
?
看到
return
這個字眼,是不是想到了函數(shù)?錯了,
sizeof
不是一個函數(shù),你見過給一個函數(shù)傳參數(shù),而不加括號的嗎?
sizeof
可以,所以
sizeof
不是函數(shù)。網(wǎng)上有人說
sizeof
是一元操作符,但是我并不這么認為,因為
sizeof
更像一個特殊的宏,它是在編譯階段求值的。舉個例子:
cout<<sizeof(int)<<endl; // 32
位機上
int
長度為
4
cout<<sizeof(1==2)<<endl; // ==
操作符返回
bool
類型,相當于
cout<<sizeof(bool)<<endl;
?
在編譯階段已經(jīng)被翻譯為:
cout<<4<<endl;
cout<<1<<endl;
?
這里有個陷阱,看下面的程序:
int a = 0;
cout<<sizeof(a=3)<<endl;
cout<<a<<endl;
?
輸出為什么是
4
,
0
而不是期望中的
4
,
3
???就在于
sizeof
在編譯階段處理的特性。由于
sizeof
不能被編譯成機器碼,所以
sizeof
作用范圍內,也就是
()
里面的內容也不能被編譯,而是被替換成類型。
=
操作符返回左操作數(shù)的類型,所以
a=3
相當于
int
,而代碼也被替換為:
int a = 0;
cout<<4<<endl;
cout<<a<<endl;
?
所以,
sizeof
是不可能支持鏈式表達式的,這也是和一元操作符不一樣的地方。
?
結論:不要把
sizeof
當成函數(shù),也不要看作一元操作符,把他當成一個特殊的編譯預處理。
2
、
sizeof
的用法
? sizeof
有兩種用法:
?
(
1
)
sizeof(object)
?
也就是對對象使用
sizeof
,也可以寫成
sizeof object
的形式。例如:
?
(
2
)
sizeof(typename)
?
也就是對類型使用
sizeof
,注意這種情況下寫成
sizeof typename
是非法的。下面舉幾個例子說明一下:
int i = 2;
cout<<sizeof(i)<<endl; // sizeof(object)
的用法,合理
cout<<sizeof i<<endl; // sizeof object
的用法,合理
cout<<sizeof 2<<endl; // 2
被解析成
類型的
object, sizeof object
的用法,合理
cout<<sizeof(2)<<endl; // 2
被解析成
int
類型的
object, sizeof(object)
的用法,合理
cout<<sizeof(int)<<endl;// sizeof(typename)
的用法,合理
cout<<sizeof int<<endl; //
錯誤!對于操作符,一定要加
()
?
可以看出,加
()
是永遠正確的選擇。
?
結論:不論
sizeof
要對誰取值,最好都加上
()
。
3
、數(shù)據(jù)類型的
sizeof
(
1
)
C++
固有數(shù)據(jù)類型
? 32
位
C++
中的基本數(shù)據(jù)類型,也就
char,short int(short),int,long int(long),float,double, long double
大小分別是:
1
,
2
,
4
,
4
,
4
,
8, 10
。
?
考慮下面的代碼:
cout<<sizeof(unsigned int) == sizeof(int)<<endl; //
相等,輸出
1
? unsigned
影響的只是最高位
bit
的意義,數(shù)據(jù)長度不會被改變的。
?
結論:
unsigned
不能影響
sizeof
的取值。
(
2
)自定義數(shù)據(jù)類型
? typedef
可以用來定義
C++
自定義類型。考慮下面的問題:
typedef short WORD;
typedef long DWORD;
cout<<(sizeof(short) == sizeof(WORD))<<endl; //
相等,輸出
1
cout<<(sizeof(long) == sizeof(DWORD))<<endl; //
相等,輸出
1
?
結論:自定義類型的
sizeof
取值等同于它的類型原形。
(
3
)函數(shù)類型
?
考慮下面的問題:
int f1(){return 0;};
double f2(){return 0.0;}
void f3(){}
cout<<sizeof(f1())<<endl; // f1()
返回值為
int
,因此被認為是
int
cout<<sizeof(f2())<<endl; // f2()
返回值為
double
,因此被認為是
double
cout<<sizeof(f3())<<endl; //
錯誤!無法對
void
類型使用
sizeof
cout<<sizeof(f1)<<endl; //
錯誤!無法對函數(shù)指針使用
sizeof ?
cout<<sizeof*f2<<endl; // *f2
,和
f2()
等價,因為可以看作
object
,所以括號不是必要的。被認為是
double
?
結論:對函數(shù)使用
sizeof
,在編譯階段會被函數(shù)返回值的類型取代,
4
、指針問題
?
考慮下面問題:
cout<<sizeof(string*)<<endl; // 4
cout<<sizeof(int*)<<endl; // 4
cout<<sizof(char****)<<endl; // 4
?
可以看到,不管是什么類型的指針,大小都是
4
的,因為指針就是
32
位的物理地址。
?
結論:只要是指針,大小就是
4
。(
64
位機上要變成
8
也不一定)。
?
順便唧唧歪歪幾句,
C++
中的指針表示實際內存的地址。和
C
不一樣的是,
C++
中取消了模式之分,也就是不再有
small,middle,big,
取而代之的是統(tǒng)一的
flat
。
flat
模式采用
32
位實地址尋址,而不再是
c
中的
segment:offset
模式。舉個例子,假如有一個指向地址
f000:8888
的指針,如果是
C
類型則是
8888(16
位
,
只存儲位移,省略段
)
,
far
類型的
C
指針是
f0008888(32
位,高位保留段地址,地位保留位移
),C++
類型的指針是
f8888(32
位,相當于段地址
*16 +
位移,但尋址范圍要更大
)
。
5
、數(shù)組問題
?
考慮下面問題:
char a[] = "abcdef";
int b[20] = {3, 4};
char c[2][3] = {"aa", "bb"};
cout<<sizeof(a)<<endl; // 7
cout<<sizeof(b)<<endl; // 20
cout<<sizeof(c)<<endl; // 6
?
數(shù)組
a
的大小在定義時未指定,編譯時給它分配的空間是按照初始化的值確定的,也就是
7
。
c
是多維數(shù)組,占用的空間大小是各維數(shù)的乘積,也就是
6
。可以看出,數(shù)組的大小就是他在編譯時被分配的空間,也就是各維數(shù)的乘積
*
數(shù)組元素的大小。
?
結論:數(shù)組的大小是各維數(shù)的乘積
*
數(shù)組元素的大小。
?
這里有一個陷阱:
int *d = new int[10];
cout<<sizeof(d)<<endl; // 4
? d
是我們常說的動態(tài)數(shù)組,但是他實質上還是一個指針,所以
sizeof(d)
的值是
4
。
?
再考慮下面的問題:
double* (*a)[3][6];
cout<<sizeof(a)<<endl; // 4
cout<<sizeof(*a)<<endl; // 72
cout<<sizeof(**a)<<endl; // 24
cout<<sizeof(***a)<<endl; // 4
cout<<sizeof(****a)<<endl; // 8
? a
是一個很奇怪的定義,他表示一個指向
double*[3][6]
類型數(shù)組的指針。既然是指針,所以
sizeof(a)
就是
4
。
?
既然
a
是執(zhí)行
double*[3][6]
類型的指針,
*a
就表示一個
double*[3][6]
的多維數(shù)組類型,因此
sizeof(*a)=3*6*sizeof(double*)=72
。同樣的,
**a
表示一個
double*[6]
類型的數(shù)組,所以
sizeof(**a)=6*sizeof(double*)=24
。
***a
就表示其中的一個元素,也就是
double*
了,所以
sizeof(***a)=4
。至于
****a
,就是一個
double
了,所以
sizeof(****a)=sizeof(double)=8
。
6
、向函數(shù)傳遞數(shù)組的問題。
?
考慮下面的問題:
#include <iostream>
using namespace std;
int Sum(int i[])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++) //
實際上,
sizeof(i) = 4
{
sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[6] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}
? Sum
的本意是用
sizeof
得到數(shù)組的大小,然后求和。但是實際上,傳入自函數(shù)
Sum
的,只是一個
int
類型的指針,所以
sizeof(i)=4
,而不是
24
,所以會產生錯誤的結果。解決這個問題的方法使是用指針或者引用。
?
使用指針的情況:
int Sum(int (*i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(*i)/sizeof(int); j++) //sizeof(*i) = 24
{
sumofi += (*i)[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(&allAges)<<endl;
system("pause");
return 0;
}
?
在這個
Sum
里,
i
是一個指向
i[6]
類型的指針,注意,這里不能用
int Sum(int (*i)[])
聲明函數(shù),而是必須指明要傳入的數(shù)組的大小,不然
sizeof(*i)
無法計算。但是在這種情況下,再通過
sizeof
來計算數(shù)組大小已經(jīng)沒有意義了,因為此時大小是指定為
6
的。
使用引用的情況和指針相似:
int Sum(int (&i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++)
{
sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}
?
這種情況下
sizeof
的計算同樣無意義,所以用數(shù)組做參數(shù),而且需要遍歷的時候,函數(shù)應該有一個參數(shù)來說明數(shù)組的大小,而數(shù)組的大小在數(shù)組定義的作用域內通過
sizeof
求值。因此上面的函數(shù)正確形式應該是:
#include <iostream>
using namespace std;
int Sum(int *i, unsigned int n)
{
int sumofi = 0;
for (int j = 0; j < n; j++)
{
sumofi += i[j];
}
return sumofi;
}
int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(i, sizeof(allAges)/sizeof(int))<<endl;
system("pause");
return 0;
}
7
、字符串的
sizeof
和
strlen
?
考慮下面的問題:
char a[] = "abcdef";
char b[20] = "abcdef";
string s = "abcdef";
cout<<strlen(a)<<endl; // 6
,字符串長度
cout<<sizeof(a)<<endl; // 7
,字符串容量
cout<<strlen(b)<<endl; // 6
,字符串長度
cout<<strlen(b)<<endl; // 20
,字符串容量
cout<<sizeof(s)<<endl; // 12,
這里不代表字符串的長度,而是
string
類的大小
cout<<strlen(s)<<endl; //
錯誤!
s
不是一個字符指針。
a[1] = '\0';
cout<<strlen(a)<<endl; // 1
cout<<sizeof(a)<<endl; // 7
,
sizeof
是恒定的
? strlen
是尋找從指定地址開始,到出現(xiàn)的第一個
0
之間的字符個數(shù),他是在運行階段執(zhí)行的,而
sizeof
是得到數(shù)據(jù)的大小,在這里是得到字符串的容量。所以對同一個對象而言,
sizeof
的值是恒定的。
string
是
C++
類型的字符串,他是一個類,所以
sizeof(s)
表示的并不是字符串的長度,而是類
string
的大小。
strlen(s)
根本就是錯誤的,因為
strlen
的參數(shù)是一個字符指針,如果想用
strlen
得到
s
字符串的長度,應該使用
sizeof(s.c_str())
,因為
string
的成員函數(shù)
c_str()
返回的是字符串的首地址。實際上,
string
類提供了自己的成員函數(shù)來得到字符串的容量和長度,分別是
Capacity()
和
Length()
。
string
封裝了常用了字符串操作,所以在
C++
開發(fā)過程中,最好使用
string
代替
C
類型的字符串。
8
、從
union
的
sizeof
問題看
cpu
的對界
?
考慮下面問題:(默認對齊方式)
union u
{
double a;
int b;
};
union u2
{
char a[13];
int b;
};
union u3
{
char a[13];
char b;
};
cout<<sizeof(u)<<endl; // 8
cout<<sizeof(u2)<<endl; // 16
cout<<sizeof(u3)<<endl; // 13
?
都知道
union
的大小取決于它所有的成員中,占用空間最大的一個成員的大小。所以對于
u
來說,大小就是最大的
double
類型成員
a
了,所以
sizeof(u)=sizeof(double)=8
。但是對于
u2
和
u3
,最大的空間都是
char[13]
類型的數(shù)組,為什么
u3
的大小是
13
,而
u2
是
16
呢?關鍵在于
u2
中的成員
int b
。由于
int
類型成員的存在,使
u2
的對齊方式變成
4
,也就是說,
u2
的大小必須在
4
的對界上,所以占用的空間變成了
16
(最接近
13
的對界)。
?
結論:復合數(shù)據(jù)類型,如
union
,
struct
,
class
的對齊方式為成員中對齊方式最大的成員的對齊方式。
?
順便提一下
CPU
對界問題,
32
的
C++
采用
8
位對界來提高運行速度,所以編譯器會盡量把數(shù)據(jù)放在它的對界上以提高內存命中率。對界是可以更改的,使用
#pragma pack(x)
宏可以改變編譯器的對界方式,默認是
8
。
C++
固有類型的對界取編譯器對界方式與自身大小中較小的一個。例如,指定編譯器按
2
對界,
int
類型的大小是
4
,則
int
的對界為
2
和
4
中較小的
2
。在默認的對界方式下,因為幾乎所有的數(shù)據(jù)類型都不大于默認的對界方式
8
(除了
long double
),所以所有的固有類型的對界方式可以認為就是類型自身的大小。更改一下上面的程序:
#pragma pack(2)
union u2
{
char a[13];
int b;
};
union u3
{
char a[13];
char b;
};
#pragma pack(8)
cout<<sizeof(u2)<<endl; // 14
cout<<sizeof(u3)<<endl; // 13
?
由于手動更改對界方式為
2
,所以
int
的對界也變成了
2
,
u2
的對界取成員中最大的對界,也是
2
了,所以此時
sizeof(u2)=14
。
?
結論:
C++
固有類型的對界取編譯器對界方式與自身大小中較小的一個。
9
、
struct
的
sizeof
問題
?
因為對齊問題使結構體的
sizeof
變得比較復雜,看下面的例子:
(
默認對齊方式下
)
struct s1
{
char a;
double b;
int c;
char d;
};
struct s2
{
char a;
char b;
int c;
double d;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16
?
同樣是兩個
char
類型,一個
int
類型,一個
double
類型,但是因為對界問題,導致他們的大小不同。計算結構體大小可以采用元素擺放法,我舉例子說明一下:首先,
CPU
判斷結構體的對界,根據(jù)上一節(jié)的結論,
s1
和
s2
的對界都取最大的元素類型,也就是
double
類型的對界
8
。然后開始擺放每個元素。
?
對于
s1
,首先把
a
放到
8
的對界,假定是
0
,此時下一個空閑的地址是
1
,但是下一個元素
d
是
double
類型,要放到
8
的對界上,離
1
最接近的地址是
8
了,所以
d
被放在了
8
,此時下一個空閑地址變成了
16
,下一個元素
c
的對界是
4
,
16
可以滿足,所以
c
放在了
16
,此時下一個空閑地址變成了
20
,下一個元素
d
需要對界
1
,也正好落在對界上,所以
d
放在了
20
,結構體在地址
21
處結束。由于
s1
的大小需要是
8
的倍數(shù),所以
21-23
的空間被保留,
s1
的大小變成了
24
。
?
對于
s2
,首先把
a
放到
8
的對界,假定是
0
,此時下一個空閑地址是
1
,下一個元素的對界也是
1
,所以
b
擺放在
1
,下一個空閑地址變成了
2
;下一個元素
c
的對界是
4
,所以取離
2
最近的地址
4
擺放
c
,下一個空閑地址變成了
8
,下一個元素
d
的對界是
8
,所以
d
擺放在
8
,所有元素擺放完畢,結構體在
15
處結束,占用總空間為
16
,正好是
8
的倍數(shù)。
?
這里有個陷阱,對于結構體中的結構體成員,不要認為它的對齊方式就是他的大小,看下面的例子:
struct s1
{
char a[8];
};
struct s2
{
double d;
};
struct s3
{
s1 s;
char a;
};
struct s4
{
s2 s;
char a;
};
cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;
? s1
和
s2
大小雖然都是
8
,但是
s1
的對齊方式是
1
,
s2
是
8
(
double
),所以在
s3
和
s4
中才有這樣的差異。
?
所以,在自己定義結構體的時候,如果空間緊張的話,最好考慮對齊因素來排列結構體里的元素。
10
、不要讓
double
干擾你的位域
?
在結構體和類中,可以使用位域來規(guī)定某個成員所能占用的空間,所以使用位域能在一定程度上節(jié)省結構體占用的空間。不過考慮下面的代碼:
struct s1
{
int i: 8;
int j: 4;
double b;
int a:3;
};
struct s2
{
int i;
int j;
double b;
int a;
};
struct s3
{
int i;
int j;
int a;
double b;
};
struct s4
{
int i: 8;
int j: 4;
int a:3;
double b;
};
cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 24
cout<<sizeof(s3)<<endl; // 24
cout<<sizeof(s4)<<endl; // 16
?
可以看到,有
double
存在會干涉到位域(
sizeof
的算法參考上一節(jié)),所以使用位域的的時候,最好把
float
類型和
double
類型放在程序的開始或者最后。
?
第一次寫東西,發(fā)現(xiàn)自己的表達能力太差了,知道的東西講不出來,講出來的東西別人也看不懂,呵呵。另外,
C99
標準的
sizeof
已經(jīng)可以工作在運行時了,打算最近找個支持
C99
的編譯器研究一下。
posted on 2006-05-24 15:01
黃大仙 閱讀(11194)
評論(4) 編輯 收藏 引用 所屬分類:
C/C++