关于内存寚w��

��迹天�� — Tue, 29 Jan 2008 01:25:00 GMT

#pragma pack�Q�n�Q?br>�W�一、如果n大于�{�于该变量所占用的字节数�Q�那么偏�U�量必须满��默认的对齐方�?br>�W�二、如果n��于该变量的�c�d��所占用的字节数�Q�那么偏�U�量为n的倍数�Q�不用满��默认的寚w��方式。结构的��d��也有个�U�束条�g�Q�分下面两种情况�Q�如果n大于所有成员变量类型所占用的字节数�Q�那么结构的��d��必��Mؓ占用�I�间最大的变量占用的空间数的倍数�Q?br>否则必须为n的倍数�?/p>

当在C中定义了一个结构类型时�Q�它的大��是否等于各字段(field)大小之和�Q�编译器��如何在内存中放�|�这些字�D�？ANSI C对结构体的内存布局有什么要求？而我们的�E�序又能否依赖这�U�布局�Q�这些问题或许对不少朋友来说�q�有�Ҏ��p�，那么本文��p��着探究它们背后的秘密�?

首先�Q�至��有一点可以肯定，那就是ANSI C保证�l�构体中各字�D�在内存中出现的位置是随它们的声明顺序依�ơ递增的，�q�且�W�一个字�D늚�首地址�{�于整个�l�构体实例的首地址。比如有�q�样一个结构体�Q?br>
struct vector{int x,y,z;} s;
int *p,*q,*r;
struct vector *ps;

p = &s.x;
q = &s.y;
r = &s.z;
ps = &s;

assert(p < q);
assert(p < r);
assert(q < r);
assert((int*)ps == p);
// 上述断言一定不会失�?/p>

�q�时�Q�有朋友可能会问:"标准是否规定盔R��字段在内存中也相�?"�?唔，对不��P��ANSI C没有做出保证�Q�你的程序在��M��时候都不应该依赖这个假设。那�q�是否意味着我们永远无法勑֋��Z��q�更清晰更精��的�l�构体内存布局图？哦，当然不是。不�q�先让我们从�q�个问题中暂时抽�w�，��x��一下另一个重要问题————内存对齐�?/p>

许多实际的计��机�pȝ��对基本类型数据在内存中存攄��位置有限�Ӟ��它们会要求这些数据的首地址的值是某个数k(通常它�ؓ4�?)的倍数�Q�这��是所谓的内存寚w��Q�而这个k则被�U�Cؓ该数据类型的寚w��模数(alignment modulus)。当一�U�类型S的对齐模��C��另一�U�类型T的对齐模数的比值是大于1的整敎ͼ�我们��q��c�d��S的对齐要求比T�?严格)�Q�而称T比S�?宽松)。这�U�强制的要求一来简化了处理器与内存之间传输�pȝ��的设计，二来可以提升��d��数据的速度。比如这么一�U�处理器�Q�它每次��d��内存的时候都从某�?倍数的地址开始，一�ơ读出或写入8个字节的数据�Q�假如��Y件能保证double�c�d��的数据都�?倍数地址开始，那么��L��写一个double�c�d��数据��只需要一�ơ内存操作。否则，我们��可能需要两�ơ内存操作才能完成这个动作，因�ؓ数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满��寚w��要求的情况下可能会出错，但是Intel的IA32架构的处理器则不��数据是否对齐都能正��工作。不�q�Intel奉劝大家�Q�如果想提升性能�Q�那么所有的�E�序数据都应该尽可能地对齐。Win32�q�_��下的微��YC�~�译�?cl.exe for 80x86)在默认情况下采用如下的对齐规�? ��M��基本数据�c�d��T的对齐模数就是T的大��，即sizeof(T)。比如对于double�c�d��(8字节)�Q�就要求该类型数据的地址��L��8的倍数�Q�而char�c�d��数据(1字节)则可以从��M��一个地址开始。Linux下的GCC奉行的是另外一套规�?在资料中查得�Q��ƈ未验证，如错误请指正):��M��2字节大小(包括单字节吗?)的数据类�?比如short)的对齐模数是2�Q�而其它所有超�q?字节的数据类�?比如long,double)都以4为对齐模数�?/p>

现在回到我们兛_��的struct上来。ANSI C规定一�U�结构类型的大小是它所有字�D늚�大小以及字段之间或字�D�尾部的填充区大��之和。嗯�Q�填充区�Q�对�Q�这��是��Z��使结构体字段满��内存寚w��要求而额外分配给�l�构体的�I�间。那么结构体本��n有什么对齐要求吗�Q�有的，ANSI C标准规定�l�构体类型的寚w��要求不能比它所有字�D�中要求最严格的那个宽松，可以更严�?但此非强制要求，VC7.1��׃��仅是让它们一样严�?。我们来看一个例�?以下所有试验的环境是Intel Celeron 2.4G + WIN2000 PRO + vc7.1�Q�内存对齐编译选项�?默认"�Q�即不指�?Zp�?pack选项):

typedef struct ms1
{
char a;
int b;
} MS1;

    假设MS1按如下方式内存布局(本文所有示意图中的内存地址从左臛_��递增):
       _____________________________
       |       |                   |
       |   a  |        b         |
       |       |                   |
       +---------------------------+
Bytes:    1             4

因�ؓMS1中有最强对齐要求的是b字段(int)�Q�所以根据编译器的对齐规则以及ANSI C标准�Q�MS1对象的首地址一定是4(int�c�d��的对齐模�?的倍数。那么上�q�内存布局中的b字段能满��int�c�d��的对齐要求吗�Q�嗯�Q�当然不能。如果你是编译器�Q�你会如何��y妙安排来满��CPU的癖好呢�Q�呵呵，�l�过1毫秒的艰苦思考，你一定得��Z��如下的方案：

       _______________________________________
       |       |\\\\\\\\\\\|                 |
       |   a  |\\padding\\|       b   |
       |       |\\\\\\\\\\\|                 |
       +-------------------------------------+
Bytes:    1         3             4

�q�个�Ҏ��在a与b之间多分配了3个填�?padding)字节�Q�这样当整个struct对象首地址满��4字节的对齐要求时�Q�b字段也一定能满��int型的4字节寚w��规定。那么sizeof(MS1)昄��应该是8�Q�而b字段相对于结构体首地址的偏�U�d��?。非常好理解�Q�对吗？现在我们把MS1中的字段交换一下顺�?

typedef struct ms2
{
int a;
char b;
} MS2;

或许你认为MS2比MS1的情况要��单，它的布局应该��是

       _______________________
       |             |       |
       |     a      |   b  |
       |             |       |
       +---------------------+
Bytes:      4           1

因�ؓMS2对象同样要满��?字节寚w��规定�Q�而此时a的地址与结构体的首地址相等�Q�所以它一定也�?字节寚w��。嗯�Q�分析得有道理，可是却不全面。让我们来考虑一下定义一个MS2�c�d��的数�l�会出现什么问题。C标准保证�Q��Q何类�?包括自定义结构类�?的数�l�所占空间的大小一定等于一个单独的该类型数据的大小乘以数组元素的个数。换句话��_��数组各元素之间不会有�I�隙。按照上面的�Ҏ��Q�一个MS2数组array的布局��是:

|<- array[1] ->|<- array[2] ->|<- array[3] .....

__________________________________________________________
|             |       |              |      |
|     a      |   b  |      a      |   b |.............
|             |       |              |      |
+----------------------------------------------------------
Bytes: 4         1          4           1

当数�l�首地址�?字节寚w��Ӟ��array[1].a也是4字节寚w��Q�可是array[2].a呢？array[3].a ....呢？可见�q�种�Ҏ��在定义结构体数组时无法让数组中所有元素的字段都满��_��齐规定，必须修改成如下�Ş�?

       ___________________________________
       |             |       |\\\\\\\\\\\|
       |     a      |   b  |\\padding\\|
       |             |       |\\\\\\\\\\\|
       +---------------------------------+
Bytes:      4           1         3

现在无论是定义一个单独的MS2变量�q�是MS2数组�Q�均能保证所有元素的所有字�D�都满��寚w��规定。那么sizeof(MS2)仍然�?�Q�而a的偏�U�Mؓ0�Q�b的偏�U�L��4�?/p>

好的�Q�现在你已经掌握了结构体内存布局的基本准则，��试分析一个稍微复杂点的类型吧�?/p>

typedef struct ms3
{
     char a;
     short b;
     double c;
} MS3;

    我想你一定能得出如下正确的布局�?

        padding
           |
      _____v_________________________________
      |   |\|     |\\\\\\\\\|               |
      | a |\| b |\padding\|       c       |
      |   |\|     |\\\\\\\\\|               |
      +-------------------------------------+
Bytes: 1 1   2       4            8

    sizeof(short)�{�于2�Q�b字段应从偶数地址开始，所以a的后面填充一个字节，而sizeof(double)�{�于8�Q�c字段要从8倍数地址开始，前面的a、b字段加上填充字节已经�? bytes�Q�所以b后面再填�?个字节就可以保证c字段的对齐要求了。sizeof(MS3)�{�于16�Q�b的偏�U�L��2�Q�c的偏�U�L��8。接着看看�l�构体中字段�q�是�l�构�c�d��的情�?

typedef struct ms4
{
char a;
MS3 b;
} MS4;

    MS3中内存要求最严格的字�D�|��c�Q�那么MS3�c�d��数据的对齐模数就与double的一�?�?)�Q�a字段后面应填�?个字节，因此MS4的布局应该�?
       _______________________________________
       |       |\\\\\\\\\\\|                 |
       |   a   |\\padding\\|       b         |
       |       |\\\\\\\\\\\|                 |
       +-------------------------------------+
Bytes:    1         7             16

昄��Q�sizeof(MS4)�{�于24�Q�b的偏�Uȝ��?�?/p>

在实际开发中�Q�我们可以通过指定/Zp�~�译选项来更改编译器的对齐规则。比如指�?Zpn(VC7.1中n可以�?�?�?�?�?6)��是告诉�~�译器最大对齐模数是n。在�q�种情况下，所有小于等于n字节的基本数据类型的寚w��规则与默认的一��P��但是大于n个字节的数据�c�d��的对齐模数被限制为n。事实上�Q�VC7.1的默认对齐选项��q��当于/Zp8。仔�l�看看MSDN对这个选项的描�q�ͼ�会发现它郑重告诫了程序员不要在MIPS和Alpha�q�_��上用/Zp1�?Zp2选项�Q�也不要�?6位��^��C��指定/Zp4�?Zp8(��x��Z��么？)。改变编译器的对齐选项�Q�对照程序运行结果重新分析上�?�U�结构体的内存布局��是一个很好的复习�?/p>

��C��q�里�Q�我们可以回�{�本文提出的最后一个问题了。结构体的内存布局依赖于CPU、操作系�l�、编译器及编译时的对齐选项�Q�而你的程序可能需要运行在多种�q�_��上，你的源代码可能要被不同的人用不同的编译器�~�译(试想你�ؓ别�h提供一个开放源码的�?�Q�那么除非绝对必需�Q�否则你的程序永�q�也不要依赖�q�些诡异的内存布局。顺便说一下，如果一个程序中的两个模块是用不同的寚w��选项分别�~�译的，那么它很可能会��生一些非常微妙的错误。如果你的程序确实有很难理解的行为，不防仔细��查一下各个模块的�~�译选项�?/p>

思考题:请分析下面几�U�结构体在你的��^��C��的内存布局�Q��ƈ试着��L��一�U�合理安排字�D�声明顺序的�Ҏ��以尽量节省内存空间�?/p>

    A. struct P1 { int a; char b; int c; char d; };
    B. struct P2 { int a; char b; char c; int d; };
    C. struct P3 { short a[3]; char b[3]; };
    D. struct P4 { short a[3]; char *b[3]; };
    E. struct P5 { struct P2 *a; char b; struct P1 a[2]; };

参考资�?

    �?】《深入理解计��机�pȝ��(修订�?》，
         (�?Randal E.Bryant; David O'Hallaron�Q?br>         (�?龚奕�?雯��春，
         中国电力出版�C�，2004

    �?】《C: A Reference Manual�?影印�?�Q?br>         (�?Samuel P.Harbison; Guy L.Steele�Q?br>         人民邮电出版�C�，2003

��迹天�� 2008-01-29 09:25 发表评论

欧美日韩高清不卡,亚洲国产精品一区二区第四页av ,久久不见久久见免费视频1

关于内存寚w��