typedef struct num { char c; int n; char cc; }num; int main() { printf("%d\n", sizeof(num)); return 0; }
好了,按道理来说我计算一个结构体大小就看他的各个成员需要消耗多大的空间, num 结构体中三个成员分别是 char ,int ,char 类型,对应 1 , 4, 1 字节大小,这么说来只需要 6 字节空间就ok了;但是——我们看看打印结果:
你说整点小误差就算了,好家伙直接歪了两倍出来,why?要解释这个问题这就需要引入 offsetof
offsetof 👏
嘛是 offsetof,本质上他是个宏,C 语言库宏 offsetof 会生成一个类型为 size_t 的整型常量(size_t是标准C库中定义的,在64位系统中为long long unsigned int),它是一个结构成员相对于结构开头的字节偏移量。声明为:
offsetof(type, member-designator)
1
其中结构体成员是由 member-designator 给定的,结构体的名称是在 type 中给定的,需要<stddef.h>头文件支持。
我们就来康康各个成员的偏移量究竟是多少
#include<stddef.h> int main() { printf("%d\n", offsetof(num,c)); printf("%d\n", offsetof(num, n)); printf("%d\n", offsetof(num, cc)); return 0; }
结果如下:
我们可以清楚的看到刚刚的 12 的组成是怎么来的了,我们知道偏移量单位是字节,我们的 0,4,8 三个偏移量单位也就是字节,num 在内存中开始存储的位置相对于第一个成员进去的位置偏移量为0,也就是在同一个位置,第一个字节偏移量为 0,第二个字节偏移量为 1,第三个字节偏移量为2,以此类推。
我们搞个图来具象一下这个过程(手残ppt)
c,cc 是一个字节的 char 类型,n 是四字节的 int 类型,所以实际上我们利用的空间就只有上面的有颜色部分。
那么新的问题又来了,为什么会有空白部分(偏移量为1,2,3和未画出的12)?空白部分又干什么去了? 那我们就要明白结构体的对齐规则。
结构体对齐规则👏
1. 结构体第一个成员存在于结构体偏移量为 0 的地址处,也就是同起点开始。
2.其他成员变量要对齐到某个数字(对齐数)整数倍的地址处。地址数等于编译器默认的一个对齐数与该成员大小的较小值(我所使用的编译器是 vs 2019,vs中默认的值为 8,但 Linux环境无默认对齐数,对齐数就是成员自身大小)
3. 结构体总大小是最大对齐数的整数倍
4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数的整数倍。
解释:
第一条很好理解吧,我们第二条就拿成员 n 来说,n 的大小为 4编译器默认对齐数为 8,取 4,8 中的较小值 4 作为对齐数。
第三条的最大对齐数如何理解呢?其实就是所有成员中对齐数最大的那个,三个成员对齐数分别是 1,4,1 ,取最大值就是 4,要是 4 的整数倍才行,我们刚好取完最后一个成员 cc 对齐数是8,整个空间 0-8 大小就是 9,9不是4 的倍数我们扔掉,然后继续浪费掉三个空间直到来到我们的 12,满足条件跳出。
举个栗子:
struct num2 { double d; char c; int n; };
因为 double 类型是 8 个字节,作为最大的成员,对齐数就是 8,从 0-15 大小为 16,16 是 8 的整数倍,因此结构体大小就是 16。嵌套情况不赘述,和一般情况同理。
存在原因👏
==So,为什么结构体会存在这种对齐机制呢 ?==两个方面:
从移植性的角度:平台不一样功能不一样,非所以硬件平台都可以访问任意地址上的任意数据,某些硬件平台只能在特定地址上取得特定的数据类型,否则就会硬件异常
从性能的角度:数据结构尤其是栈这种,应该尽可能的从自然边界上对齐,原因就是为了访问内存,处理器需要对散序的空间作两次内存访问;而对齐的内存仅仅需要一次,也就是我们常用的手法:用空间换时间
如果说在结构对齐方式不合适的时候,我们能自己更改默认对齐数来提高性能吗? 当然可以!
#pragma pack(num)
{
……
return 0;
}
#pragma pack()
这个宏可以取消默认对齐数,括号里 num 设置成自己满意的对齐数,最后再用这个宏取消自己的设置即可。