C语言第三十一弹---自定义类型：结构体(下)-阿里云开发者社区

C语言第三十一弹---自定义类型：结构体(下)

2024-03-26 117

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： C语言第三十一弹---自定义类型：结构体(下)

上一弹我们讲解了结构体内存对齐的规则，那为什么我们需要内存对齐呢？

我们通过这一弹来进行讲解。

1、结构体内存对齐

1.1、为什么存在内存对齐?

大部分的参考资料都是这样说的：

1. 平台原因 (移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。

2. 性能原因：

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节，则地址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对齐成8的倍数，那么就可以用⼀个内存操作来读或者写值了。否则，我们可能需要执行两次内存访问，因为对象可能被分放在两个8字节内存块中。

总体来说：结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到：

让占用空间小的成员尽量集中在⼀起

//例如：
struct S1
 {
 char c1;
 int i;
 char c2;
 };
struct S2
 {
 char c1;
 char c2;
 int i;
 };

S1 和 S2 类型的成员⼀模⼀样，但是 S1 和 S2 所占空间的大小有了⼀些区别。

很显然，根据上一弹讲解的内存对齐规则，S1所占的空间更大。

1.2、修改默认对齐数

#pragma 这个预处理指令，可以改变编译器的默认对齐数。

#include <stdio.h>
#pragma pack(1)//设置默认对齐数为1
struct S
{
 char c1;
 int i;
 char c2;
};
#pragma pack()//取消设置的对齐数，还原为默认
int main()
{
 //输出的结果是什么？
 printf("%d\n", sizeof(struct S));
 return 0;
}

根据上一弹结构体内存对齐规则，可知该结构体的大小如上图，即6字节。

结构体在对齐方式不合适的时候，我们可以自己更改默认对齐数。

2、结构体传参

struct S
{
 int data[1000];
 int num;
};
struct S s = {{1,2,3,4}, 1000};
//结构体传参
void print1(struct S s)
{
 printf("%d\n", s.num);
}
//结构体地址传参
void print2(struct S* ps)
{
 printf("%d\n", ps->num);
}
int main()
{
 print1(s); //传结构体
 print2(&s); //传地址
 return 0;
}

上面的 print1 和 print2 函数哪个好些？

答案是：首选print2函数。

原因：

函数传参的时候，参数是需要压栈，会有时间和空间上的系统开销。

如果传递⼀个结构体对象的时候，结构体过大，参数压栈的的系统开销比较大，所以会导致性能的下降。

结论：

结构体传参的时候，要传结构体的地址。

3、结构体实现位段

结构体讲完就得讲讲结构体实现位段的能力。

3.1、什么是位段

位段，C语言允许在一个结构体中以位为单位来指定其成员所占内存长度，这种以位为单位的成员称为“位段”或称“位域”( bit field) 。利用位段能够用较少的位数存储数据。

位段的声明和结构是类似的，有两个不同：

1. 位段的成员必须是 int、unsigned int 或signed int ，在C99中位段成员的类型也可以

选择其他类型。

2. 位段的成员名后边有⼀个冒号和⼀个数字。

比如：

struct A
{
 int _a:2;
 int _b:5;
 int _c:10;
 int _d:30;
};

A就是⼀个位段类型。

那里面的冒号和数字又表示什么呢？

首先我们要明白位段中的这个“位”字其实指的是二进制位。

我们知道一个二进制位就是1个比特位。

所以，A中int _a:2; 其实表示的就是_a的大小是2bit;

同理：

_b的大小是5bit

_c的大小是10bit

_d的大小是30bit

知道各自占用的内存空间之后，是不是将内存空间相加就是该结构体的真实内存大小呢？

2+5+10+30=47bit 因为一字节等于8bit，47bit接近6字节，是不是结构体空间就是6字节？我们通过VS测试来揭晓一下答案。

printf("%d\n", sizeof(struct A));

此处uu们肯定疑惑，刚刚算出来还不到6字节，为什么答案就是8字节呢？接下来我们来进行深入讲解。

3.2、位段的内存分配

从上面的讲解我们知道：

1. 位段的成员可以是 int、unsigned int、signed int 或者是 char 等类型

那位段所需的空间是如何分配的呢？

2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。

此句话该怎么理解呢？

就是说，如果位段的成员全部是整型的（位段成员一般都是同类型的），那上去就先给这个位段开辟4个字节的空间，如果不够用，放不下所有的成员，那就再开辟4个字节的空间，还不够用，继续开辟，以此类推。如果成员全部是char类型的，那就一次开辟1个字节的空间，直至放得下所有成员。

注意：

3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

我们知道这些位段的规则之后，那么上面的struct A的内存大小是如何计算出来的呢？

根据上述规则可知，位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的，此处为int类型字段，因此需要先开辟4字节空间，但是此处是小端存储还是大端存储呢？我们前面讲解的VS中整数在内存中的存储可知，VS采用小端存储，那么此处我们也采用小端存储来计算大小，先占用2bit空间，如上图绿色方框，再占用5bit空间，如上图橙色方框，再占用10bit空间，但是此处第一个字节只剩1bit空间了，空间不够，需要占用新的空间，如上图蓝色方框，但是，最后占用30bit，同理空间不够需要占用新的空间，先占用8bit，但是此处已经没有空间了，所以需要再创建4字节空间，然后按照上图存放在内存空间中，如上图紫色方框。因此该结构体内存大小为8字节。

我们虽然根据上面的规则和VS整数在内存中存储得出上面结果，但是就一定是这样？下面我们再用一个例子证明一下。

//一个例子
struct S
{
  char a : 3;
  char b : 4;
  char c : 5;
  char d : 4;
};
int main()
{
  struct S s = { 0 };
  s.a = 10;
  s.b = 12;
  s.c = 3;
  s.d = 4;
  //空间是如何开辟的？
  return 0;
}

根据上述结构体字段的规则，此处内存的占用如上图。

此时还是证明不了内存中真实如何存储，此时我们可以赋值一些值进行验证。

现在通过调试看看结构体s在内存中是如何存储的。

根据VS编译器的调试可知，结构体位段在VS中是按照小端进行存储的，但是不是所有编译器都是这样，因此用到其他编译器时需要自行证明。

3.3、位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。

2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。

3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。

4. 当⼀个结构包含两个位段，第⼆个位段成员比较大，无法容纳于第⼀个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比，位段可以达到同样的效果，并且可以很好的节省空间，但是有跨平台的问题存在。

3.4、位段的应用

下图是网络协议中，IP数据报的格式，我们可以看到其中很多的属性只需要几个bit位就能描述，这里使用位段，能够实现想要的效果，也节省了空间，这样网络传输的数据报大小也会较小⼀些，对网络的畅通是有帮助的。

3.5、位段使用的注意事项

位段的几个成员共有同⼀个字节，这样有些成员的起始位置并不是某个字节的起始位置，那么这些位置处是没有地址的。内存中每个字节分配⼀个地址，⼀个字节内部的bit位是没有地址的。

所以不能对位段的成员使用&操作符，这样就不能使用scanf直接给位段的成员输入值，只能是先输入放在⼀个变量中，然后赋值给位段的成员。

struct A
{
 int _a : 2;
 int _b : 5;
 int _c : 10;
 int _d : 30;
};
int main()
{
 struct A sa = {0};
 scanf("%d", &sa._b);//这是错误的
 
 //正确的⽰范
 int b = 0;
 scanf("%d", &b);
 sa._b = b;
 return 0;
}

总结

本篇博客就结束啦，谢谢大家的观看，如果公主少年们有好的建议可以留言喔，谢谢大家啦！

C语言第三十一弹---自定义类型：结构体(下)

1、结构体内存对齐

1.1、为什么存在内存对齐?

1.2、修改默认对齐数

2、结构体传参

3、结构体实现位段

3.1、什么是位段

3.2、位段的内存分配

3.3、位段的跨平台问题

3.4、位段的应用

3.5、位段使用的注意事项

总结

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

C语言第三十一弹---自定义类型：结构体(下)

1、结构体内存对齐

1.1、为什么存在内存对齐?

1.2、修改默认对齐数

2、结构体传参

3、结构体实现位段

3.1、什么是位段

3.2、位段的内存分配

3.3、位段的跨平台问题

3.4、位段的应用

3.5、位段使用的注意事项

总结

热门文章

最新文章

相关课程

相关电子书