有些信息在存储时,并不需要占用一个完整的字节,而只需要一个或几个二进制位即可;比如:在存放一个开关量时,只有0和1两种状态,只需要使用一个二进制位即可存储;为了节省存储空间,C语言提供了一种数据结构,称为"位域"或"位段";所谓"位域"就是把一个字节中的8个二进制位划分为几个不同的区域,并说明每个区域的二进制位数;每一个位域都有一个位域名,允许程序员在程序中按照位域名进行访问;这样就可以把几个不同的对象用一个字节的二进制位域来表示;
一、定义
1、位域的定义与结构体的定义相仿;格式如下:
   struct 位域结构名
   {
     类型说明符1 位域名1:位域长度1; //最低位;
     类型说明符2 位域名2:位域长度2; //次低位;
     类型说明符3 位域名3:位域长度3;
     ......
     类型说明符N 位域名N:位域长度M; //最高位;其中,N∈[0,1,2.....],M∈[0,8];
   };
   其中,N∈[0,1,2.....],M∈[0,8];
   例如:
   struct BitField
   {
     int a:8;
     int b:2;
     int c:6;
   };
2、位域变量的说明与结构体变量的说明方式相同;可采用三种方式:先定义后说明、同时定义说明、直接说明;例如:
   struct BitField
   {
     int a:8;
     int b:2;
     int c:6;
   } data;
   说明位域变量data,共占用2个字节;其中,位域a占8bit,位域b占2bit,位域c占6bit
3、位域变量的使用与结构体变量的使用方法相同,有两种形式:
   变量:  位域变量名.位域名
   指针:  位域指针名->位域名
二、位域的定义有以下几点限制
1、一个位域必须存储在同一个字节中,不能跨两个字节;当一个字节所剩空间不够存放下一个位域时,应该从下一个存储单元的起始地址处开始存放该位域;也可以有意使某位域从下一个存储单元的起始地址处开始存放;
   例如:
   struct BitField
   {
      unsigned int a:4;  //占用4个二进制位;
      unsigned int  :0;  //空位域,自动置0;
      unsigned int b:4;  //占用4个二进制位,从下一个存储单元开始存放;
      unsigned int c:4;  //占用4个二进制位;
      unsigned int d:5;  //占用5个二进制位,剩余的4个bit不够存储4个bit的数据,从下一个存储单元开始存放;
      unsigned int  :0;  //空位域,自动置0;
      unsigned int e:4;  //占用4个二进制位,从这个存储单元开始存放;
   };
   在这个位域定义中,a占用第一个字节的前4位,后面的4个二进制位不使用,自动置0;b从第二个字节处开始存放,占用4位;c占用4位;d从第三个字节处开始存放,占用5位,后面的3位不够存储下一个位域的4位,故设为空位域,不使用,自动置0;e从第四个字节处开始存放,占用4位;
2、由于一个位域不允许横跨两个字节,因此,一个位域的长度不能超过一个字节的长度,也就是说,不能超过8个二进制位;
3、一个位域可以是无名位域,这时这个位域只能用作填充或调整位置;无名位域是不能使用的;例如:
   struct BitField
   {
     unsigned int a:1;
     unsigned int  :2; //无名位域,不能使用,只能用作填充或调整位置;
     unsigned int b:3;
     unsigned int c:2;
   };
从以上分析可知,位域在本质上仍然是一种结构体,只是其成员是按照二进制位分配的;
三、位域的存储规则
使用位域的主要目的是压缩存储,其大致规则为:
1.如果相邻的两个位域字段的类型相同,且其位宽之和小于其类型的sizeof()大小,则其后面的位域字段将紧邻前一个字段存储,直到不能容纳为止;
  比如:一个位域变量有三个位域字段a、b、c,且类型完全相同,位域字段a和b的位宽之和小于其类型的sizeof()大小,那么位域字段c紧接着位域字段b后面存储;
2.如果相邻的两个位域字段的类型相同,且其位宽之和大于其类型的sizeof()大小,则后面的位域字段将从下一个存储单元的起始地址处开始存放,其偏移量恰好为其类型的sizeof()大小的整数倍;
  比如:拿第1点中的例子来说,如果位域字段a和b的位宽之和大于其类型的sizeof()大小,则位域字段c就从下一个存储单元的起始地址初开始存放,其偏移量恰好是其类型的sizeof()大小的整数倍;
3.如果相邻的两个位域字段的类型不同,则各个编译器的具体实现有差异,VC6采取不压缩方式,GCC和Dev-C++都采用压缩方式;
4.如果位域字段之间穿插着非位域字段,则不进行压缩;
5.整个位域结构体的大小为其最宽基本类型成员大小的整数倍;
  比如:
  struct BFA
  {
    unsigned char a:2;
    unsigned char b:3;
    unsigned char c:3;
  };
  struct BFB
  {
    unsigned char a:2;
    unsigned char b:3;
    unsigned char c:3;
    unsigned int  d:4;  //多出来这个位域字段;
  };
  sizeof(BFA)=1, sizeof(BFB)=8;
  这也说明了第三点中"相邻两个位于字段类型不相同时,VC6采取不压缩的方式"
6.位域字段在内存中的位置是按照从低位向高位的顺序放置的;
  struct BitField
  {
    unsigned char a:2;  //最低位;
    unsigned char b:3;
    unsigned char c:3;  //最高位;
  };
  union Union
  {
    struct BitField bf;
    unsigned int n;
  };
  union Union ubf;
  ubf.n = 0;    //初始化;
  ubf.bf.a = 0; //二进制为: 000
  ubf.bf.b = 0; //二进制为: 000
  ubf.bf.c = 1; //二进制为: 001
  printf("ubf.bf.n = %u\n", ubf.n);
  位域中的位域字段按照从低位向高位顺序方式的顺序来看,那么,a、b、c这三个位域字段在内存中的放置情况是:
  最高位是c:001,中间位是b:000,最低位是a:000;所以,这个位域结构中的8二进制内容就是: 00100000,总共8个位,其十进制格式就是32;
  实际上打印出来的ubf.n值就是32;
  ubf.n = 100; //二进制为: 01100100
  printf("ubf.bf.a = %d, ubf.bf.b = %d, ubf.bf.c = %d\n", ubf.bf.a, ubf.bf.b, ubf.bf.c);
  此时,对于位域ubf.bf来说,其位于字段仍然按照从低位向高位顺序方式的顺序放置,则,最高位是c:011,中间位是b:001,最低位是a:00;
  所以,ubf.bf.a = 0; ubf.bf.b = 1; ubf.bf.c = 3;
  实际上打印出来的结果也的确如此;
7.取地址操作符&不能应用在位域字段上;
8.位域字段不能是类的静态成员;

05-11 22:23