有些信息在存储时,并不需要占用一个完整的字节,而只需要一个或几个二进制位即可;比如:在存放一个开关量时,只有0和1两种状态,只需要使用一个二进制位即可存储;为了节省存储空间,C语言提供了一种数据结构,称为"位域"或"位段";所谓"位域"就是把一个字节中的8个二进制位划分为几个不同的区域,并说明每个区域的二进制位数;每一个位域都有一个位域名,允许程序员在程序中按照位域名进行访问;这样就可以把几个不同的对象用一个字节的二进制位域来表示;
一、定义
1、位域的定义与结构体的定义相仿;格式如下:
struct 位域结构名
{
类型说明符1 位域名1:位域长度1; //最低位;
类型说明符2 位域名2:位域长度2; //次低位;
类型说明符3 位域名3:位域长度3;
......
类型说明符N 位域名N:位域长度M; //最高位;其中,N∈[0,1,2.....],M∈[0,8];
};
其中,N∈[0,1,2.....],M∈[0,8];
例如:
struct BitField
{
int a:8;
int b:2;
int c:6;
};
2、位域变量的说明与结构体变量的说明方式相同;可采用三种方式:先定义后说明、同时定义说明、直接说明;例如:
struct BitField
{
int a:8;
int b:2;
int c:6;
} data;
说明位域变量data,共占用2个字节;其中,位域a占8bit,位域b占2bit,位域c占6bit
3、位域变量的使用与结构体变量的使用方法相同,有两种形式:
变量: 位域变量名.位域名
指针: 位域指针名->位域名
二、位域的定义有以下几点限制
1、一个位域必须存储在同一个字节中,不能跨两个字节;当一个字节所剩空间不够存放下一个位域时,应该从下一个存储单元的起始地址处开始存放该位域;也可以有意使某位域从下一个存储单元的起始地址处开始存放;
例如:
struct BitField
{
unsigned int a:4; //占用4个二进制位;
unsigned int :0; //空位域,自动置0;
unsigned int b:4; //占用4个二进制位,从下一个存储单元开始存放;
unsigned int c:4; //占用4个二进制位;
unsigned int d:5; //占用5个二进制位,剩余的4个bit不够存储4个bit的数据,从下一个存储单元开始存放;
unsigned int :0; //空位域,自动置0;
unsigned int e:4; //占用4个二进制位,从这个存储单元开始存放;
};
在这个位域定义中,a占用第一个字节的前4位,后面的4个二进制位不使用,自动置0;b从第二个字节处开始存放,占用4位;c占用4位;d从第三个字节处开始存放,占用5位,后面的3位不够存储下一个位域的4位,故设为空位域,不使用,自动置0;e从第四个字节处开始存放,占用4位;
2、由于一个位域不允许横跨两个字节,因此,一个位域的长度不能超过一个字节的长度,也就是说,不能超过8个二进制位;
3、一个位域可以是无名位域,这时这个位域只能用作填充或调整位置;无名位域是不能使用的;例如:
struct BitField
{
unsigned int a:1;
unsigned int :2; //无名位域,不能使用,只能用作填充或调整位置;
unsigned int b:3;
unsigned int c:2;
};
从以上分析可知,位域在本质上仍然是一种结构体,只是其成员是按照二进制位分配的;
三、位域的存储规则
使用位域的主要目的是压缩存储,其大致规则为:
1.如果相邻的两个位域字段的类型相同,且其位宽之和小于其类型的sizeof()大小,则其后面的位域字段将紧邻前一个字段存储,直到不能容纳为止;
比如:一个位域变量有三个位域字段a、b、c,且类型完全相同,位域字段a和b的位宽之和小于其类型的sizeof()大小,那么位域字段c紧接着位域字段b后面存储;
2.如果相邻的两个位域字段的类型相同,且其位宽之和大于其类型的sizeof()大小,则后面的位域字段将从下一个存储单元的起始地址处开始存放,其偏移量恰好为其类型的sizeof()大小的整数倍;
比如:拿第1点中的例子来说,如果位域字段a和b的位宽之和大于其类型的sizeof()大小,则位域字段c就从下一个存储单元的起始地址初开始存放,其偏移量恰好是其类型的sizeof()大小的整数倍;
3.如果相邻的两个位域字段的类型不同,则各个编译器的具体实现有差异,VC6采取不压缩方式,GCC和Dev-C++都采用压缩方式;
4.如果位域字段之间穿插着非位域字段,则不进行压缩;
5.整个位域结构体的大小为其最宽基本类型成员大小的整数倍;
比如:
struct BFA
{
unsigned char a:2;
unsigned char b:3;
unsigned char c:3;
};
struct BFB
{
unsigned char a:2;
unsigned char b:3;
unsigned char c:3;
unsigned int d:4; //多出来这个位域字段;
};
sizeof(BFA)=1, sizeof(BFB)=8;
这也说明了第三点中"相邻两个位于字段类型不相同时,VC6采取不压缩的方式"
6.位域字段在内存中的位置是按照从低位向高位的顺序放置的;
struct BitField
{
unsigned char a:2; //最低位;
unsigned char b:3;
unsigned char c:3; //最高位;
};
union Union
{
struct BitField bf;
unsigned int n;
};
union Union ubf;
ubf.n = 0; //初始化;
ubf.bf.a = 0; //二进制为: 000
ubf.bf.b = 0; //二进制为: 000
ubf.bf.c = 1; //二进制为: 001
printf("ubf.bf.n = %u\n", ubf.n);
位域中的位域字段按照从低位向高位顺序方式的顺序来看,那么,a、b、c这三个位域字段在内存中的放置情况是:
最高位是c:001,中间位是b:000,最低位是a:000;所以,这个位域结构中的8二进制内容就是: 00100000,总共8个位,其十进制格式就是32;
实际上打印出来的ubf.n值就是32;
ubf.n = 100; //二进制为: 01100100
printf("ubf.bf.a = %d, ubf.bf.b = %d, ubf.bf.c = %d\n", ubf.bf.a, ubf.bf.b, ubf.bf.c);
此时,对于位域ubf.bf来说,其位于字段仍然按照从低位向高位顺序方式的顺序放置,则,最高位是c:011,中间位是b:001,最低位是a:00;
所以,ubf.bf.a = 0; ubf.bf.b = 1; ubf.bf.c = 3;
实际上打印出来的结果也的确如此;
7.取地址操作符&不能应用在位域字段上;
8.位域字段不能是类的静态成员;