c++探索
玩玩

隨筆 - 25 文章 - 29 trackbacks - 0

2006年5月

>

日

一

二

三

四

五

六

30

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

常用鏈接

留言簿(4)

隨筆分類(22)

隨筆檔案(25)

文章分類(2)

C/C++(2)
QT

文章檔案(2)

2006年5月 (2)

相冊

myface

搜索

積分與排名

積分 - 57413
排名 - 406

閱讀排行榜

評論排行榜

c/c++數組與sizeof的基礎知識

1 、什么是 sizeof

? 首先看一下 sizeof 在 msdn 上的定義：

? The sizeof keyword gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value of type size_t.

? 看到 return 這個字眼，是不是想到了函數？錯了， sizeof 不是一個函數，你見過給一個函數傳參數，而不加括號的嗎？ sizeof 可以，所以 sizeof 不是函數。網上有人說 sizeof 是一元操作符，但是我并不這么認為，因為 sizeof 更像一個特殊的宏，它是在編譯階段求值的。舉個例子：

cout<<sizeof(int)<<endl; // 32 位機上 int 長度為 4
cout<<sizeof(1==2)<<endl; // == 操作符返回 bool 類型，相當于 cout<<sizeof(bool)<<endl;

? 在編譯階段已經被翻譯為：

cout<<4<<endl;
cout<<1<<endl;

? 這里有個陷阱，看下面的程序：

int a = 0;
cout<<sizeof(a=3)<<endl;
cout<<a<<endl;

? 輸出為什么是 4 ， 0 而不是期望中的 4 ， 3 ？？？就在于 sizeof 在編譯階段處理的特性。由于 sizeof 不能被編譯成機器碼，所以 sizeof 作用范圍內，也就是 () 里面的內容也不能被編譯，而是被替換成類型。 = 操作符返回左操作數的類型，所以 a=3 相當于 int ，而代碼也被替換為：

int a = 0;
cout<<4<<endl;
cout<<a<<endl;

? 所以， sizeof 是不可能支持鏈式表達式的，這也是和一元操作符不一樣的地方。

? 結論：不要把 sizeof 當成函數，也不要看作一元操作符，把他當成一個特殊的編譯預處理。

2 、 sizeof 的用法

? sizeof 有兩種用法：

? （ 1 ） sizeof(object)
? 也就是對對象使用 sizeof ，也可以寫成 sizeof object 的形式。例如：

? （ 2 ） sizeof(typename)
? 也就是對類型使用 sizeof ，注意這種情況下寫成 sizeof typename 是非法的。下面舉幾個例子說明一下：

int i = 2;
cout<<sizeof(i)<<endl; // sizeof(object) 的用法，合理
cout<<sizeof i<<endl; // sizeof object 的用法，合理
cout<<sizeof 2<<endl; // 2 被解析成 int 類型的 object, sizeof object 的用法，合理
cout<<sizeof(2)<<endl; // 2 被解析成 int 類型的 object, sizeof(object) 的用法，合理
cout<<sizeof(int)<<endl;// sizeof(typename) 的用法，合理
cout<<sizeof int<<endl; // 錯誤！對于操作符，一定要加 ()

? 可以看出，加 () 是永遠正確的選擇。

? 結論：不論 sizeof 要對誰取值，最好都加上 () 。

3 、數據類型的 sizeof

（ 1 ） C++ 固有數據類型

? 32 位 C++ 中的基本數據類型，也就 char,short int(short),int,long int(long),float,double, long double
大小分別是： 1 ， 2 ， 4 ， 4 ， 4 ， 8, 10 。

? 考慮下面的代碼：

cout<<sizeof(unsigned int) == sizeof(int)<<endl; // 相等，輸出 1

? unsigned 影響的只是最高位 bit 的意義，數據長度不會被改變的。

? 結論： unsigned 不能影響 sizeof 的取值。

（ 2 ）自定義數據類型

? typedef 可以用來定義 C++ 自定義類型。考慮下面的問題：

typedef short WORD;
typedef long DWORD;
cout<<(sizeof(short) == sizeof(WORD))<<endl; // 相等，輸出 1
cout<<(sizeof(long) == sizeof(DWORD))<<endl; // 相等，輸出 1

? 結論：自定義類型的 sizeof 取值等同于它的類型原形。

（ 3 ）函數類型

? 考慮下面的問題：

int f1(){return 0;};
double f2(){return 0.0;}
void f3(){}

cout<<sizeof(f1())<<endl; // f1() 返回值為 int ，因此被認為是 int
cout<<sizeof(f2())<<endl; // f2() 返回值為 double ，因此被認為是 double
cout<<sizeof(f3())<<endl; // 錯誤！無法對 void 類型使用 sizeof
cout<<sizeof(f1)<<endl; // 錯誤！無法對函數指針使用 sizeof ?
cout<<sizeof*f2<<endl; // *f2 ，和 f2() 等價，因為可以看作 object ，所以括號不是必要的。被認為是 double

? 結論：對函數使用 sizeof ，在編譯階段會被函數返回值的類型取代，

4 、指針問題

? 考慮下面問題：

cout<<sizeof(string*)<<endl; // 4
cout<<sizeof(int*)<<endl; // 4
cout<<sizof(char****)<<endl; // 4

? 可以看到，不管是什么類型的指針，大小都是 4 的，因為指針就是 32 位的物理地址。

? 結論：只要是指針，大小就是 4 。（ 64 位機上要變成 8 也不一定）。

? 順便唧唧歪歪幾句， C++ 中的指針表示實際內存的地址。和 C 不一樣的是， C++ 中取消了模式之分，也就是不再有 small,middle,big, 取而代之的是統一的 flat 。 flat 模式采用 32 位實地址尋址，而不再是 c 中的 segment:offset 模式。舉個例子，假如有一個指向地址 f000:8888 的指針，如果是 C 類型則是 8888(16 位 , 只存儲位移，省略段 ) ， far 類型的 C 指針是 f0008888(32 位，高位保留段地址，地位保留位移 ),C++ 類型的指針是 f8888(32 位，相當于段地址 *16 + 位移，但尋址范圍要更大 ) 。

5 、數組問題

? 考慮下面問題：

char a[] = "abcdef";
int b[20] = {3, 4};
char c[2][3] = {"aa", "bb"};

cout<<sizeof(a)<<endl; // 7
cout<<sizeof(b)<<endl; // 20
cout<<sizeof(c)<<endl; // 6

? 數組 a 的大小在定義時未指定，編譯時給它分配的空間是按照初始化的值確定的，也就是 7 。 c 是多維數組，占用的空間大小是各維數的乘積，也就是 6 。可以看出，數組的大小就是他在編譯時被分配的空間，也就是各維數的乘積 * 數組元素的大小。

? 結論：數組的大小是各維數的乘積 * 數組元素的大小。

? 這里有一個陷阱：

int *d = new int[10];

cout<<sizeof(d)<<endl; // 4

? d 是我們常說的動態數組，但是他實質上還是一個指針，所以 sizeof(d) 的值是 4 。

? 再考慮下面的問題：

double* (*a)[3][6];

cout<<sizeof(a)<<endl; // 4
cout<<sizeof(*a)<<endl; // 72
cout<<sizeof(**a)<<endl; // 24
cout<<sizeof(***a)<<endl; // 4
cout<<sizeof(****a)<<endl; // 8

? a 是一個很奇怪的定義，他表示一個指向 double*[3][6] 類型數組的指針。既然是指針，所以 sizeof(a) 就是 4 。

? 既然 a 是執行 double*[3][6] 類型的指針， *a 就表示一個 double*[3][6] 的多維數組類型，因此 sizeof(*a)=3*6*sizeof(double*)=72 。同樣的， **a 表示一個 double*[6] 類型的數組，所以 sizeof(**a)=6*sizeof(double*)=24 。 ***a 就表示其中的一個元素，也就是 double* 了，所以 sizeof(***a)=4 。至于 ****a ，就是一個 double 了，所以 sizeof(****a)=sizeof(double)=8 。

6 、向函數傳遞數組的問題。

? 考慮下面的問題：
#include <iostream>
using namespace std;

int Sum(int i[])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++) // 實際上， sizeof(i) = 4
{
sumofi += i[j];
}
return sumofi;
}

int main()
{
int allAges[6] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}

? Sum 的本意是用 sizeof 得到數組的大小，然后求和。但是實際上，傳入自函數 Sum 的，只是一個 int 類型的指針，所以 sizeof(i)=4 ，而不是 24 ，所以會產生錯誤的結果。解決這個問題的方法使是用指針或者引用。

? 使用指針的情況：
int Sum(int (*i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(*i)/sizeof(int); j++) //sizeof(*i) = 24
{
sumofi += (*i)[j];
}
return sumofi;
}

int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(&allAges)<<endl;
system("pause");
return 0;
}
? 在這個 Sum 里， i 是一個指向 i[6] 類型的指針，注意，這里不能用 int Sum(int (*i)[]) 聲明函數，而是必須指明要傳入的數組的大小，不然 sizeof(*i) 無法計算。但是在這種情況下，再通過 sizeof 來計算數組大小已經沒有意義了，因為此時大小是指定為 6 的。
使用引用的情況和指針相似：

int Sum(int (&i)[6])
{
int sumofi = 0;
for (int j = 0; j < sizeof(i)/sizeof(int); j++)
{
sumofi += i[j];
}
return sumofi;
}

int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(allAges)<<endl;
system("pause");
return 0;
}
? 這種情況下 sizeof 的計算同樣無意義，所以用數組做參數，而且需要遍歷的時候，函數應該有一個參數來說明數組的大小，而數組的大小在數組定義的作用域內通過 sizeof 求值。因此上面的函數正確形式應該是：
#include <iostream>
using namespace std;

int Sum(int *i, unsigned int n)
{
int sumofi = 0;
for (int j = 0; j < n; j++)
{
sumofi += i[j];
}
return sumofi;
}

int main()
{
int allAges[] = {21, 22, 22, 19, 34, 12};
cout<<Sum(i, sizeof(allAges)/sizeof(int))<<endl;
system("pause");
return 0;
}

7 、字符串的 sizeof 和 strlen

? 考慮下面的問題：

char a[] = "abcdef";
char b[20] = "abcdef";
string s = "abcdef";

cout<<strlen(a)<<endl; // 6 ，字符串長度
cout<<sizeof(a)<<endl; // 7 ，字符串容量
cout<<strlen(b)<<endl; // 6 ，字符串長度
cout<<strlen(b)<<endl; // 20 ，字符串容量
cout<<sizeof(s)<<endl; // 12, 這里不代表字符串的長度，而是 string 類的大小
cout<<strlen(s)<<endl; // 錯誤！ s 不是一個字符指針。

a[1] = '\0';
cout<<strlen(a)<<endl; // 1
cout<<sizeof(a)<<endl; // 7 ， sizeof 是恒定的

? strlen 是尋找從指定地址開始，到出現的第一個 0 之間的字符個數，他是在運行階段執行的，而 sizeof 是得到數據的大小，在這里是得到字符串的容量。所以對同一個對象而言， sizeof 的值是恒定的。 string 是 C++ 類型的字符串，他是一個類，所以 sizeof(s) 表示的并不是字符串的長度，而是類 string 的大小。 strlen(s) 根本就是錯誤的，因為 strlen 的參數是一個字符指針，如果想用 strlen 得到 s 字符串的長度，應該使用 sizeof(s.c_str()) ，因為 string 的成員函數 c_str() 返回的是字符串的首地址。實際上， string 類提供了自己的成員函數來得到字符串的容量和長度，分別是 Capacity() 和 Length() 。 string 封裝了常用了字符串操作，所以在 C++ 開發過程中，最好使用 string 代替 C 類型的字符串。

8 、從 union 的 sizeof 問題看 cpu 的對界

? 考慮下面問題：（默認對齊方式）

union u
{
double a;
int b;
};

union u2
{
char a[13];
int b;
};

union u3
{
char a[13];
char b;
};

cout<<sizeof(u)<<endl; // 8
cout<<sizeof(u2)<<endl; // 16
cout<<sizeof(u3)<<endl; // 13

? 都知道 union 的大小取決于它所有的成員中，占用空間最大的一個成員的大小。所以對于 u 來說，大小就是最大的 double 類型成員 a 了，所以 sizeof(u)=sizeof(double)=8 。但是對于 u2 和 u3 ，最大的空間都是 char[13] 類型的數組，為什么 u3 的大小是 13 ，而 u2 是 16 呢？關鍵在于 u2 中的成員 int b 。由于 int 類型成員的存在，使 u2 的對齊方式變成 4 ，也就是說， u2 的大小必須在 4 的對界上，所以占用的空間變成了 16 （最接近 13 的對界）。

? 結論：復合數據類型，如 union ， struct ， class 的對齊方式為成員中對齊方式最大的成員的對齊方式。

? 順便提一下 CPU 對界問題， 32 的 C++ 采用 8 位對界來提高運行速度，所以編譯器會盡量把數據放在它的對界上以提高內存命中率。對界是可以更改的，使用 #pragma pack(x) 宏可以改變編譯器的對界方式，默認是 8 。 C++ 固有類型的對界取編譯器對界方式與自身大小中較小的一個。例如，指定編譯器按 2 對界， int 類型的大小是 4 ，則 int 的對界為 2 和 4 中較小的 2 。在默認的對界方式下，因為幾乎所有的數據類型都不大于默認的對界方式 8 （除了 long double ），所以所有的固有類型的對界方式可以認為就是類型自身的大小。更改一下上面的程序：

#pragma pack(2)
union u2
{
char a[13];
int b;
};

union u3
{
char a[13];
char b;
};
#pragma pack(8)

cout<<sizeof(u2)<<endl; // 14
cout<<sizeof(u3)<<endl; // 13

? 由于手動更改對界方式為 2 ，所以 int 的對界也變成了 2 ， u2 的對界取成員中最大的對界，也是 2 了，所以此時 sizeof(u2)=14 。

? 結論： C++ 固有類型的對界取編譯器對界方式與自身大小中較小的一個。

9 、 struct 的 sizeof 問題

? 因為對齊問題使結構體的 sizeof 變得比較復雜，看下面的例子： ( 默認對齊方式下 )

struct s1
{
char a;
double b;
int c;
char d;
};

struct s2
{
char a;
char b;
int c;
double d;
};

cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16

? 同樣是兩個 char 類型，一個 int 類型，一個 double 類型，但是因為對界問題，導致他們的大小不同。計算結構體大小可以采用元素擺放法，我舉例子說明一下：首先， CPU 判斷結構體的對界，根據上一節的結論， s1 和 s2 的對界都取最大的元素類型，也就是 double 類型的對界 8 。然后開始擺放每個元素。
? 對于 s1 ，首先把 a 放到 8 的對界，假定是 0 ，此時下一個空閑的地址是 1 ，但是下一個元素 d 是 double 類型，要放到 8 的對界上，離 1 最接近的地址是 8 了，所以 d 被放在了 8 ，此時下一個空閑地址變成了 16 ，下一個元素 c 的對界是 4 ， 16 可以滿足，所以 c 放在了 16 ，此時下一個空閑地址變成了 20 ，下一個元素 d 需要對界 1 ，也正好落在對界上，所以 d 放在了 20 ，結構體在地址 21 處結束。由于 s1 的大小需要是 8 的倍數，所以 21-23 的空間被保留， s1 的大小變成了 24 。
? 對于 s2 ，首先把 a 放到 8 的對界，假定是 0 ，此時下一個空閑地址是 1 ，下一個元素的對界也是 1 ，所以 b 擺放在 1 ，下一個空閑地址變成了 2 ；下一個元素 c 的對界是 4 ，所以取離 2 最近的地址 4 擺放 c ，下一個空閑地址變成了 8 ，下一個元素 d 的對界是 8 ，所以 d 擺放在 8 ，所有元素擺放完畢，結構體在 15 處結束，占用總空間為 16 ，正好是 8 的倍數。

? 這里有個陷阱，對于結構體中的結構體成員，不要認為它的對齊方式就是他的大小，看下面的例子：

struct s1
{
char a[8];
};

struct s2
{
double d;
};

struct s3
{
s1 s;
char a;
};

struct s4
{
s2 s;
char a;
};

cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;

? s1 和 s2 大小雖然都是 8 ，但是 s1 的對齊方式是 1 ， s2 是 8 （ double ），所以在 s3 和 s4 中才有這樣的差異。

? 所以，在自己定義結構體的時候，如果空間緊張的話，最好考慮對齊因素來排列結構體里的元素。

10 、不要讓 double 干擾你的位域

? 在結構體和類中，可以使用位域來規定某個成員所能占用的空間，所以使用位域能在一定程度上節省結構體占用的空間。不過考慮下面的代碼：

struct s1
{
int i: 8;
int j: 4;
double b;
int a:3;
};

struct s2
{
int i;
int j;
double b;
int a;
};

struct s3
{
int i;
int j;
int a;
double b;
};

struct s4
{
int i: 8;
int j: 4;
int a:3;
double b;
};

cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 24
cout<<sizeof(s3)<<endl; // 24
cout<<sizeof(s4)<<endl; // 16

? 可以看到，有 double 存在會干涉到位域（ sizeof 的算法參考上一節），所以使用位域的的時候，最好把 float 類型和 double 類型放在程序的開始或者最后。

? 第一次寫東西，發現自己的表達能力太差了，知道的東西講不出來，講出來的東西別人也看不懂，呵呵。另外， C99 標準的 sizeof 已經可以工作在運行時了，打算最近找個支持 C99 的編譯器研究一下。

posted on 2006-05-24 15:01 黃大仙閱讀(11242) 評論(4) 編輯收藏引用所屬分類: C/C++

FeedBack:

# re: c/c++數組與sizeof的基礎知識 2011-10-11 08:53 caixia

不錯回復更多評論

# re: c/c++數組與sizeof的基礎知識 2015-05-27 15:21 shirley

寫的很好了。回復更多評論

# re: c/c++數組與sizeof的基礎知識 2015-11-10 11:57 守望者在這里

博主寫的非常好解惑了謝謝我還轉載了回復更多評論

# re: c/c++數組與sizeof的基礎知識 2016-05-04 21:20 秦強

寫的很深，受益匪淺啊回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。


相關文章: c/c++數組與sizeof的基礎知識 C++預處理宏.doc

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品