编译器的字节对齐方式
前文
目前手上的项目里因为某些特殊的结构体需要使用到编译器的字节对齐,因此又重新了解了一下
正文
在C语言中,结构是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float、char等)的变量,也可以是一些复合数据类型(如数组、结构体、联合等)的数据单元。在结构中,编译器为结构的每个成员按其自然边界分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
为了使CPU能对变量进行快速访问,变量的起始地址应该具有某些特性,即所谓的“对齐”。比如4字节的int型,其起始地址应该位于4字节的边界上,即起始地址能够被4整除。
需要字节对齐的根本原因在于CPU访问数据的效率问题。字节对齐可以便于CPU快速访问,同时合理的利用字节对齐可以有效地节省存储空间。拿一台32位机器来说,其默认的字节对齐方式为4字节。因此在这台机器上,4字节对齐能够使CPU访问速度提高,比如说一个long类型的变量,如果跨越了4字节边界进行存储,那么CPU在读取变量的值时,需要读取两次,这样就会降低效率。而且,如果在32位机器中使用1字节对齐或者2字节对齐,也会使变量访问速度降低。这也就是在之前的代码走查中提到的慎用修改机器默认的字节对齐方式的原因。
可以得出结论,CPU访问数据的效率,既跟处理器类型有关,也跟编译器的类型有关,比如vc中默认是4字节对齐,GNU gcc也是默认4字节对齐,擅自修改字节对齐方式,会降低程序的效率。
而在缺省情况下,C语言的编译器为每一个变量或是数据类单元按其自然对接条件分配空间。一般通过下面的方法来改变缺省的对接条件:
- 使用伪指令 pragma pack(n) :C编译器将按照n个字节对齐
- 使用伪指令 pragma pack() :取消自定义字节对齐方式
近期工作中发现了一个有意思的点:
typedef struct test_struct
{
int a;
long b;
int c;
long d;
} test_struct;
**编译器的默认字节对齐方式为4字节,在不修改编译器字节对齐方式的前提下,我以为整个结构体所占的内存空间大小为:4+8+4+8=24字节,然而实际情况却告诉我结构体的内存大小为:8+8+8+8=32字节。**
也就是说,编译器会自动在两个int型的变量后面分别填充4字节,使得变量的长度和整个结构体对齐。(我之前一直以为4——>8字节的过程中是不会出现这个问题的...因为8是4的倍数)。以后并不能这样想当然,还是要针对每个具体问题具体分析