7.内存对齐存在的合理性
大部分的参考资料都是这样讲的:
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。
总的来讲:内存对齐是一种拿空间换取时间的做法
那么在设计结构体的时候,怎样避免不必要的内存浪费呢?
让空间小的结构体成员尽量集中在一起。
例如:
struct S1 { char c1; int i; char c2; }; struct S2 { char c1; char c2; int i; };
S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
8.修改默认对齐数
修改默认对齐数使用的是 #pragma pack(8)
#include <stdio.h> #pragma pack(8)//设置默认对齐数为8 struct S1 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 #pragma pack(1)//设置默认对齐数为1 struct S2 { char c1; int i; char c2; }; #pragma pack()//取消设置的默认对齐数,还原为默认 int main() { //输出的结果是什么? printf("%d\n", sizeof(struct S1));//12 printf("%d\n", sizeof(struct S2));//6 return 0; }
运行结果:
结构体在对齐方式不合适的时候,我们可以自己更改默认对齐数。
9.结构体传参
看案例:
struct S { int data[1000]; int num; }; struct S s = {{1,2,3,4}, 1000}; //结构体传参 void print1(struct S s) { printf("%d\n", s.num); } //结构体地址传参 void print2(struct S* ps) { printf("%d\n", ps->num); } int main() { print1(s); //传结构体 print2(&s); //传地址 return 0; }
上面的print1 和print2 函数哪个好些?
答案是:首选print2函数。
解释:
- 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
- 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。
结论:结构体传参时,要传递结构体的地址。
10.结构体实现位段
什么是位段:
位段的声明与结构体是类似的,但是有两个不同的地方:
- 位段的成员必须是int、unsigned int 或signed int 。
- 位段的成员名后边有一个冒号和一个数字。(这里的数字规定了该变量占用的二进制位是多少位,并不是字节数,而是二进制位数)
例如:
struct A { int _a:2; int _b:5; int _c:10; int _d:30; };
这里的A就是一个位段类型的声明。那么位段A的大小是多少呢?
struct A { int _a : 2; int _b : 5; int _c : 10; int _d : 30; }; int main() { printf("%d ", sizeof(struct A)); return 0; }
11.位段的内存分配
- 位段的成员可以是int unsigned int signed int 或者是char (属于整形家族)类型。
- 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
看一个位段的案例:
struct S { char a : 3; char b : 4; char c : 5; char d : 4; }; int main() { struct S s = { 0 }; printf("%d ",sizeof(s)); s.a = 10; s.b = 12; s.c = 3; s.d = 4; return 0; }
s变量的内存又是如何开辟的呢?(这里假设地址从左至右是增高的,并且按照的是小端存储。)
这里由于成员都是char类型的,所以会先开辟一个字节的空间,开始存储元素,第一个成员a占用3个二进制位(假设从低位开始存储),第二个成员b占用4个比特位。第三个成员c要占用5个比特位,但是此时只剩余一个比特位了,不足以存储c,所以还需要另外再开辟一个字节的空间用于存储c成员(假设第一个字节剩余的那一个比特位不再使用)。第四个成员d占用4个比特位,但是第二个字节只剩三个比特位了,此时仍需开辟一个字节的空间用于存储d成员。至此所有成员存储完毕。所以位段 struct S占用3个字节的空间。
接着对四个成员进行赋值,括号里的是实际存储在内存中的内容。(当二进制位高于内存中已分配好的二进制位时,高位的部分将会被舍弃,低位部分的内容会被保留)
最终存储的结果如图所示:那么从低地址到高地址读取内存中的内容(以四个二进制位位单位)那么就是:62 03 04,那么来验证一下。
注意:但是以上的分析都是针对visual studio编译器的,对于其他平台,不一定适用。
12.位段的跨平台性
位段的跨平台性是非常差的,因为不同的编译器的规则是不同的。具体原因如下:
- int 位段被当成有符号数还是无符号数是不确定的。
- 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。(上面我的分析只是在visual studio编译器中适用)
- 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。(在visual studio编译器中则是直接舍弃,但是在其他编译器中就不得而知了)
结论:
跟结构体相比,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在。
13.位段的应用
- 压缩数据结构:位段可以用于压缩数据结构,将多个成员存储在较小的内存空间中。通过使用适当的位宽,可以有效地减小数据结构的大小,减少内存占用。
- 位字段标志:位段可以用于表示某个标志或开关的状态。例如,一个字节中的每个位可以表示一个开关的状态,每个位的值为0或1,从而节省了额外的存储空间。
- 位掩码:位段可以用于进行位操作和位运算。通过使用适当的位宽,可以将多个标志或选项存储在一个字节或一个字中,并使用位操作来读取、设置或清除特定的位。
- 硬件寄存器表示:位段可以用于表示硬件寄存器的位字段。在嵌入式系统或底层编程中,位段可以方便地与硬件寄存器进行交互,以读取或设置特定的位。
完结
结构体的全部内容就到这里啦,若有不足,欢迎评论区指正,下期见!