现在的位置: 首页 > 综合 > 正文

小议大小端模式对C语言的共用体结构的影响

2013年10月13日 ⁄ 综合 ⁄ 共 2566字 ⁄ 字号 评论关闭

文章出处:http://blog.csdn.net/ce123/article/details/7097026

 

1、一些问题

问题1

#include "stdio.h"  
union   
{  
    int i;  
    char ch[2];  
}key;  
main()  
{  
    key.i=65*256+66;  
    printf("%c\t%c\n",key.ch[0],key.ch[1]);  
}  

答案是B      A;为什么不是A      B呢?

        在前面的文章中我们已经测试过,X86体系结构的CPU是小端模式的。比如一个数0x1234,放在内存里按照内存地址从低往高实际上是低地址字节里放的是0x34,高字节里放的是0x12。小端模式和我们平时感觉上的一致,把数位数越高的部分放在地址越高的部分。union类型是共享内存的,union中是按照从低到高放的,i=0x4142,也就是低地址中放的是42,高地址中放的是41,按照ch[0],ch[1]的顺序输出就是B      A。如果是大端模式的话就是打印两个空了,故不会出现A      B的情况。

 

问题2

union myun   
{  
   struct { int x; int y; int z; }u;   
   int k;   
}a;   
int main()   
{   
   a.u.x =4;  
   a.u.y =5;   
   a.u.z =6;   
   a.k = 0;   
   printf("%d %d %d\n",a.u.x,a.u.y,a.u.z);  
   return 0;  
}  

    union类型是共享内存的,以size最大的结构作为自己的大小,这样的话,myun这个结构就包含u这个结构体,而大小也等于u这个结构体的大小,在内存中的排列为声明的顺序x,y,z从低到高,然后赋值的时候,在内存中,就是x的位置放置4,y的位置放置5,z的位置放置6,现在对k赋值,对k的赋值因为是union,要共享内存,所以从union的首地址开始放置,首地址开始的位置其实是x的位置,这样原来内存中x的位置就被k所赋的值代替了,就变为0了,这个时候要进行打印,就直接看内存里就行了,x的位置也就是k的位置是0,而y,z的位置的值没有改变,所以应该是0,5,6。

 

问题3

int checkCPU()  
{  
  union   
  {  
    int a;  
    char b;  
  }c;  
  c.a = 1;  
  return (c.b == 1);  // 小端返回TRUE,大端返回FALSE  
}  

 

这个就不详细解释了,用来判定CPU大小端模式的一个经典例子。

 

问题4

union {  
    int a[2];  
    long b;  
    char c[4];  
}s;  
main()  
{  
    s.a[0]=0x12345678;  
    s.a[1]=0x23456789;  
    printf("%lx\n",s.b);  
    printf("%x,%x,%x,%x\n",s.c[0],s.c[1],s.c[2],s.c[3]);  
} 

 

答案是:
12345678  
78,56,34,12

 

问题5

# include <stdio.h>  
main()  
{  
    union {  
        long i;  
        int k;  
        char ii;  
        char s[4];  
    } mix ;  
    mix.k=0x23456789;  
    printf("mix.i=%lx\n",mix.i);  
    printf("mix.k=%x\n",mix.k);  
    printf("mix.ii=%x\n",mix.ii);  
    printf("mix.s[0]=%x\tmix.s[1]=%x\n",mix.s[0],mix.s[1]);  
    printf("mix.s[2]=%x\tmix.s[3]=%x\n",mix.s[2],mix.s[3]);  
    return 0;  
} 

 

答案是:
mix.i=23456789
mix.k=23456789
mix.ii=ffffff89
mix.s[0]=ffffff89 mix.s[1]=67
mix.s[2]=45 mix.s[3]=23
出现f是因为把char型强制转换成int型输出,0x89最高位1000 1001最高位为1,转换为int类型的时候认为是负数,而且数在计算机中是按补码存储的,所以自然高位补1了。

2、这是一个什么问题

2.1、共用体结构的意义

问题:
假设网络节点A 和网络节点B 中的通信协议涉及四类报文,报文格式为“报文类型字段+报文内容的结构体”,四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4,如何编写程序以最简单的方式组
织一个统一的报文数据结构。
分析:
报文的格式为“报文类型+报文内容的结构体”,在真实的通信中,每次只能发四类报文中的一种,我们可以将四类报文的结构体组织为一个union(共享一段内存,但每次有效的只是一种),然后和报文类型字段统一组织成一个报文数据结构。

解答:

typedef unsigned char BYTE;  
//报文内容联合体  
typedef union tagPacketContent  
{  
  STRUCTTYPE1 pkt1;  
  STRUCTTYPE2 pkt2;  
  STRUCTTYPE3 pkt1;  
  STRUCTTYPE4 pkt2;  
}PacketContent;  
//统一的报文数据结构  
typedef struct tagPacket  
{  
  BYTE pktType;  
  PacketContent pktContent;  
}Packet;  

当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用共用体;当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n 选1”),我们也可以使用共用体来发挥其长处。把几种不同类型的变量放到同一段内存单元中,这些变量在内存中占用的字节数可能不同,但都从同一个地址开始存放。也就是使用覆盖技术,几个变量互相覆盖。同一个内存段可以用来存放几种不同类型的成员,但在每一瞬间只能存放其中一种,而不能同时存放几种。即,每一瞬间只有一个成员起作用,其他的成员不起作用,不能同时存在和起作用。共用体变量中起作用的成员是最后一次存放的成员,在存入一个新的成员后原有的成员就失去了作用。

 

2.2、大小端模式对共用体的影响

        当共用体中有不同类型的变量,用一种变量类型给共用体赋值,但用另一种变量类型读取共用体的时候就涉及到大小端的问题。比如在问题1中,给int类型的变量i赋值,但通过char类型的数组来读取时,就要注意字节序的问题,也就是大小端的问题。

 

 

抱歉!评论已关闭.