现在的位置: 首页 > 综合 > 正文

内存对界与pragma pack指令

2014年07月10日 ⁄ 综合 ⁄ 共 4595字 ⁄ 字号 评论关闭

原文:http://www.th7.cn/Program/cp/201209/92293.shtml

                 http://blog.csdn.net/jamesf1982/article/details/4375719

lsj注:(1)这里我先说几个关键点:enum都是int类型存储的。enum state{a,b,c,d,e};此时sizeof(state)=4,同时对界也是int类型对界的。

       (2)Union内部需要对界的。

Union u{

char str[13];

        int a;

}

sizefo(u) = 16,说明内部进行了一个对界,并且按照最大的类型int来进行对界。

这里两个注解看不懂,先跳过后再回头看。


1、内存对界原理

         在C语言中,结构是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构、联合等)的数据单元。在结构中,编译器为结构的每个成员按其自然对界(alignment)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。

struct{
         char x1;
         short x2;
         doule x3;
         char x4;
         short x5;
};

内存地址分配如下图:

 

 

x1为结构体的第一个成员,其地址和整个结构的地址相同,因而其偏移地址为0。

x2为short类型,其大小为2,因而其自然对界也为2,所以其偏移地址必须为2的整数倍,所以编译器在x2和x1之间添充了1个空字节。这样,x2的偏移地址为2。(注意这里说的是便宜地址)

x3为double类型,其大小为8,因而其自然对界也为8,所以其偏移地址必须是8的整数倍,所以编译器在x3和x2之间添充了4个空字节。这样,x3的偏移地址为8。

同理,可以算出x4的偏移地址为16,紧跟着x3存储。x5的偏移地址为18。

最后,由于结构整体长度的计算必须取所用过的所有对齐参数的整数倍,不够补空字节;也就是取所用过的所有对齐参数中最大的那个值的整数倍,因为对齐参数都是2的n次方;这样在处理数组时可以保证每一项都边界对齐;

由于x3要求8字节对界,是该结构所有成员中要求的最大对界单元,因而整个结构struct1的自然对界条件为8字节(注意不是该结构的总大小),所以该结构的大小必须满足8的整数倍,这就要求在x5之后还要再添充4个字节,使整个结构体的大小为24字节。

 

为什么要对界?

         需要字节对齐的根本原因在于CPU访问数据的效率问题。假设上面整型变量的地址不是自然对齐,比如为0x00000002,则CPU如果取它的值的话需要访问两次内存,第一次取从0x00000002-0x00000003的一个short,第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据,如果变量在0x00000003地址上的话则要访问三次内存,第一次为char,第二次为short,第三次为char,然后组合得到整型数据。而如果变量在自然对齐位置上,则只要一次就可以取出数据。一些系统对对齐要求非常严格,比如sparc系统,如果取未对齐的数据会发生错误。

2、更改C编译器的缺省字节对齐方式

这里有三点很重要:
        (1)每个成员分别按自己的方式对齐,并能最小化长度
        (2)复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂类型时,可以最小化长度
        (3)对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保证每一项都边界对齐

        补充一下,对于数组,比如:
             char a[3];这种,它的对齐方式和分别写3个char是一样的.也就是说它还是按1个字节对齐.
             如果写: typedef char Array3[3];
             Array3这种类型的对齐方式还是按1个字节对齐,而不是按它的长度.
            不论类型是什么,对齐的边界一定是1,2,4,8,16,32,64....中的一个.

例子:

#pragma pack(4)

typedef struct

{

    char buf[3];

    word a;

}kk;
//去掉对齐方式声明
#pragma pack() 

对齐的原则是min(sizeof(word ),4)=2,因此是2字节对齐,而不是我们认为的4字节对齐。

 

语法:
#pragma pack( [show] | [push | pop] [, identifier], n )

说明:
       (1)pack提供数据声明级别的控制,对定义不起作用;
       (2)调用pack时不指定参数,n将被设成默认值;
       (3)一旦改变数据类型的alignment,直接效果就是占用memory的减少,但是performance会下降;

 

语法具体分析:
       (1)show:可选参数;显示当前packing aligment的字节数,以warning message的形式被显示;
       (2)push:可选参数;将当前指定的packing alignment数值进行压栈操作,这里的栈是the internal compiler stack,同时设置当前的packing alignment为n;如果n没有指定,则将当前的packing alignment数值压栈;
       (3)pop:可选参数;从internal compiler stack中删除最顶端的record;如果没有指定n,则当前栈顶record即为新的packing alignment数值;如果指定了n,则n将成为新的packing aligment数值;如果指定了identifier,则internal compiler stack中的record都将被pop直到identifier被找到,然后pop出identitier,同时设置packing alignment数值为当前栈顶的record;如果指定的identifier并不存在于internal
compiler stack,则pop操作被忽略;
      (4)identifier:可选参数;当同push一起使用时,赋予当前被压入栈中的record一个名称;当同pop一起使用时,从internal compiler stack中pop出所有的record直到identifier被pop出,如果identifier没有被找到,则忽略pop操作;
      (5)n:可选参数;指定packing的数值,以字节为单位;缺省数值是8,合法的数值分别是1、2、4、8、16。

 

注:默认对齐方式为8

 

更改c编译器的缺省字节对齐方式:
在缺省情况下,c编译器为每一个变量或数据单元按其自然对界条件分配空间;一般地可以通过下面的两种方法来改变缺省的对界条件:
方法一:
使用#pragma pack(n),指定c编译器按照n个字节对齐;
使用#pragma pack(),取消自定义字节对齐方式。

方法二:
__attribute(aligned(n)),让所作用的数据成员对齐在n字节的自然边界上;如果结构中有成员的长度大于n,则按照最大成员的长度来对齐;
__attribute((packed)),取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。


重要的规则:

        (1)复杂类型中各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个类型的地址相同;
        (2)每个成员分别对齐,即每个成员按自己的方式对齐,并最小化长度;规则就是每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数中较小的一个对齐;
        (3)结构、联合或者类的数据成员,第一个放在偏移为0的地方;以后每个数据成员的对齐,按照#pragma pack指定的数值和这个数据成员自身长度两个中比较小的那个进行;也就是说,当#pragma pack指定的值等于或者超过所有数据成员长度的时候,这个指定值的大小将不产生任何效果;
       (4)复杂类型(如结构)整体的对齐是按照结构体中长度最大的数据成员和#pragma pack指定值之间较小的那个值进行;这样在成员是复杂类型时,可以最小化长度;
       (5)结构整体长度的计算必须取所用过的所有对齐参数的整数倍,不够补空字节;也就是取所用过的所有对齐参数中最大的那个值的整数倍,因为对齐参数都是2的n次方;这样在处理数组时可以保证每一项都边界对齐;

 

3、例子说明

例子1:

#pragma pack(4)
class TestB
{
public:
int aa; //第一个成员,放在[0,3]偏移的位置,
  char a; //第二个成员,自身长为1,#pragma pack(4),取小值,也就是1,所以这个成员按一字节对齐,放在偏移[4]的位置。
  short b; //第三个成员,自身长2,#pragma pack(4),取2,按2字节对齐,所以放在偏移[6,7]的位置。
  char c; //第四个,自身长为1,放在[8]的位置。
};
可见,此类实际占用的内存空间是9个字节。根据规则5,结构整体的对齐是min( sizeof( int ), pack_value ) = 4,所以sizeof( TestB ) = 12;

例子2:

#pragma pack(2)
class TestB
{
public:
int aa; //第一个成员,放在[0,3]偏移的位置,
  char a; //第二个成员,自身长为1,#pragma pack(4),取小值,也就是1,所以这个成员按一字节对齐,放在偏移[4]的位置。
  short b; //第三个成员,自身长2,#pragma pack(4),取2,按2字节对齐,所以放在偏移[6,7]的位置。
  char c; //第四个,自身长为1,放在[8]的位置。
};
可见结果与例子一相同,各个成员的位置没有改变,但是此时结构整体的对齐是min( sizeof( int ), pack_value ) = 2,所以sizeof( TestB ) = 10;

例子3:

#pragma pack(4)
class TestC
{
public:
char a; //第一个成员,放在[0]偏移的位置,
  short b; //第二个成员,自身长2,#pragma pack(4),取2,按2字节对齐,所以放在偏移[2,3]的位置。
  char c; //第三个,自身长为1,放在[4]的位置。
};
整个类的实际内存消耗是5个字节,整体按照min( sizeof( short ), 4 ) = 2对齐,所以结果是sizeof( TestC ) = 6;

例子4:

struct Test
{
char x1; //第一个成员,放在[0]位置,
short x2; //第二个成员,自身长度为2,按2字节对齐,所以放在偏移[2,3]的位置,
float x3; //第三个成员,自身长度为4,按4字节对齐,所以放在偏移[4,7]的位置,
char x4; //第四个陈冠,自身长度为1,按1字节对齐,所以放在偏移[8]的位置,
};
所以整个结构体的实际内存消耗是9个字节,但考虑到结构整体的对齐是4个字节,所以整个结构占用的空间是12个字节。

抱歉!评论已关闭.