内存对界与pragma pack指令

现在的位置: 首页 > 综合 > 正文

RSS

内存对界与pragma pack指令

2014年07月10日 ⁄ 综合 ⁄ 共 4595字 ⁄ 字号小中大 ⁄ 评论关闭

原文：http://www.th7.cn/Program/cp/201209/92293.shtml

http://blog.csdn.net/jamesf1982/article/details/4375719

lsj注：（1）这里我先说几个关键点：enum都是int类型存储的。enum state{a,b,c,d,e};此时sizeof(state)=4，同时对界也是int类型对界的。

（2）Union内部需要对界的。

Union u{

char str[13];

int a;

}

sizefo(u) = 16，说明内部进行了一个对界，并且按照最大的类型int来进行对界。

这里两个注解看不懂，先跳过后再回头看。

1、内存对界原理

在C语言中，结构是一种复合数据类型，其构成元素既可以是基本数据类型（如int、long、float等）的变量，也可以是一些复合数据类型（如数组、结构、联合等）的数据单元。在结构中，编译器为结构的每个成员按其自然对界（alignment）条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个结构的地址相同。

struct{
         char x1;
         short x2;
         doule x3;
         char x4;
         short x5;
};

内存地址分配如下图：

x1为结构体的第一个成员，其地址和整个结构的地址相同，因而其偏移地址为0。

x2为short类型，其大小为2，因而其自然对界也为2，所以其偏移地址必须为2的整数倍，所以编译器在x2和x1之间添充了1个空字节。这样，x2的偏移地址为2。（注意这里说的是便宜地址）

x3为double类型，其大小为8，因而其自然对界也为8，所以其偏移地址必须是8的整数倍，所以编译器在x3和x2之间添充了4个空字节。这样，x3的偏移地址为8。

同理，可以算出x4的偏移地址为16，紧跟着x3存储。x5的偏移地址为18。

最后，由于结构整体长度的计算必须取所用过的所有对齐参数的整数倍，不够补空字节；也就是取所用过的所有对齐参数中最大的那个值的整数倍，因为对齐参数都是2的n次方；这样在处理数组时可以保证每一项都边界对齐；

由于x3要求8字节对界，是该结构所有成员中要求的最大对界单元，因而整个结构struct1的自然对界条件为8字节（注意不是该结构的总大小），所以该结构的大小必须满足8的整数倍，这就要求在x5之后还要再添充4个字节，使整个结构体的大小为24字节。

为什么要对界？

需要字节对齐的根本原因在于CPU访问数据的效率问题。假设上面整型变量的地址不是自然对齐，比如为0x00000002，则CPU如果取它的值的话需要访问两次内存，第一次取从0x00000002-0x00000003的一个short，第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据，如果变量在0x00000003地址上的话则要访问三次内存，第一次为char，第二次为short，第三次为char，然后组合得到整型数据。而如果变量在自然对齐位置上，则只要一次就可以取出数据。一些系统对对齐要求非常严格，比如sparc系统，如果取未对齐的数据会发生错误。

2、更改C编译器的缺省字节对齐方式

这里有三点很重要:
        （1）每个成员分别按自己的方式对齐,并能最小化长度
        （2）复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂类型时,可以最小化长度
        （3）对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保证每一项都边界对齐

        补充一下,对于数组,比如:
             char a[3];这种,它的对齐方式和分别写3个char是一样的.也就是说它还是按1个字节对齐.
             如果写: typedef char Array3[3];
             Array3这种类型的对齐方式还是按1个字节对齐,而不是按它的长度.
            不论类型是什么,对齐的边界一定是1,2,4,8,16,32,64....中的一个.

例子：

#pragma pack(4)

typedef struct

{

    char buf[3];

    word a;

}kk;
//去掉对齐方式声明
#pragma pack()

对齐的原则是min(sizeof(word ),4)=2,因此是2字节对齐，而不是我们认为的4字节对齐。

语法：
#pragma pack( [show] | [push | pop] [, identifier], n )

说明：
       （1）pack提供数据声明级别的控制，对定义不起作用；
       （2）调用pack时不指定参数，n将被设成默认值；
       （3）一旦改变数据类型的alignment，直接效果就是占用memory的减少，但是performance会下降；

语法具体分析：
       （1）show：可选参数；显示当前packing aligment的字节数，以warning message的形式被显示；
       （2）push：可选参数；将当前指定的packing alignment数值进行压栈操作，这里的栈是the internal compiler stack，同时设置当前的packing alignment为n；如果n没有指定，则将当前的packing alignment数值压栈；
       （3）pop：可选参数；从internal compiler stack中删除最顶端的record；如果没有指定n，则当前栈顶record即为新的packing alignment数值；如果指定了n，则n将成为新的packing aligment数值；如果指定了identifier，则internal compiler stack中的record都将被pop直到identifier被找到，然后pop出identitier，同时设置packing alignment数值为当前栈顶的record；如果指定的identifier并不存在于internal
compiler stack，则pop操作被忽略；
      （4）identifier：可选参数；当同push一起使用时，赋予当前被压入栈中的record一个名称；当同pop一起使用时，从internal compiler stack中pop出所有的record直到identifier被pop出，如果identifier没有被找到，则忽略pop操作；
      （5）n：可选参数；指定packing的数值，以字节为单位；缺省数值是8，合法的数值分别是1、2、4、8、16。

注：默认对齐方式为8

更改c编译器的缺省字节对齐方式：
在缺省情况下，c编译器为每一个变量或数据单元按其自然对界条件分配空间；一般地可以通过下面的两种方法来改变缺省的对界条件：
方法一：
使用#pragma pack(n)，指定c编译器按照n个字节对齐；
使用#pragma pack()，取消自定义字节对齐方式。

方法二：
__attribute(aligned(n))，让所作用的数据成员对齐在n字节的自然边界上；如果结构中有成员的长度大于n，则按照最大成员的长度来对齐；
__attribute((packed))，取消结构在编译过程中的优化对齐，按照实际占用字节数进行对齐。

重要的规则：

        （1）复杂类型中各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个类型的地址相同；
        （2）每个成员分别对齐，即每个成员按自己的方式对齐，并最小化长度；规则就是每个成员按其类型的对齐参数（通常是这个类型的大小）和指定对齐参数中较小的一个对齐；
        （3）结构、联合或者类的数据成员，第一个放在偏移为0的地方；以后每个数据成员的对齐，按照#pragma pack指定的数值和这个数据成员自身长度两个中比较小的那个进行；也就是说，当#pragma pack指定的值等于或者超过所有数据成员长度的时候，这个指定值的大小将不产生任何效果；
       （4）复杂类型（如结构）整体的对齐是按照结构体中长度最大的数据成员和#pragma pack指定值之间较小的那个值进行；这样在成员是复杂类型时，可以最小化长度；
       （5）结构整体长度的计算必须取所用过的所有对齐参数的整数倍，不够补空字节；也就是取所用过的所有对齐参数中最大的那个值的整数倍，因为对齐参数都是2的n次方；这样在处理数组时可以保证每一项都边界对齐；

3、例子说明

例子1：

#pragma pack(4)
class TestB
{
public:
int aa; //第一个成员，放在[0,3]偏移的位置，
　　char a; //第二个成员，自身长为1，#pragma pack(4),取小值，也就是1，所以这个成员按一字节对齐，放在偏移[4]的位置。
　　short b; //第三个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[6,7]的位置。
　　char c; //第四个，自身长为1，放在[8]的位置。
};
可见，此类实际占用的内存空间是9个字节。根据规则5，结构整体的对齐是min( sizeof( int ), pack_value ) = 4，所以sizeof( TestB ) = 12;

例子2：

#pragma pack(2)
class TestB
{
public:
int aa; //第一个成员，放在[0,3]偏移的位置，
　　char a; //第二个成员，自身长为1，#pragma pack(4),取小值，也就是1，所以这个成员按一字节对齐，放在偏移[4]的位置。
　　short b; //第三个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[6,7]的位置。
　　char c; //第四个，自身长为1，放在[8]的位置。
};
可见结果与例子一相同，各个成员的位置没有改变，但是此时结构整体的对齐是min( sizeof( int ), pack_value ) = 2，所以sizeof( TestB ) = 10；

例子3：

#pragma pack(4)
class TestC
{
public:
char a; //第一个成员，放在[0]偏移的位置，
　　short b; //第二个成员，自身长2，#pragma pack(4)，取2，按2字节对齐，所以放在偏移[2,3]的位置。
　　char c; //第三个，自身长为1，放在[4]的位置。
};
整个类的实际内存消耗是5个字节，整体按照min( sizeof( short ), 4 ) = 2对齐，所以结果是sizeof( TestC ) = 6；

例子4：

struct Test
{
char x1; //第一个成员，放在[0]位置，
short x2; //第二个成员，自身长度为2，按2字节对齐，所以放在偏移[2,3]的位置，
float x3; //第三个成员，自身长度为4，按4字节对齐，所以放在偏移[4,7]的位置，
char x4; //第四个陈冠，自身长度为1，按1字节对齐，所以放在偏移[8]的位置，
};
所以整个结构体的实际内存消耗是9个字节，但考虑到结构整体的对齐是4个字节，所以整个结构占用的空间是12个字节。

【上篇】inline与C语言中的宏
【下篇】C语言的const关键字与指针搭配使用

作者: rarity

该日志由 rarity 于10年前发表在综合分类下，最后更新于 2014年07月10日.
转载请注明: 内存对界与pragma pack指令 | 学步园 +复制链接

抱歉!评论已关闭.

学步园