10秒改struct性能直接提升15%,产品姐姐都夸我好棒

简介: 如果您以前写过 Golang ,那您很可能见过或者写过 Struct 结构体。但是,您可能不知道,通过简单地重新排序结构体中的字段,您可以极大地提高 Go 程序的速度和内存使用率!

如果您以前写过 Golang ,那您很可能见过或者写过 Struct 结构体。但是,您可能不知道,通过简单地重新排序结构体中的字段,您可以极大地提高 Go 程序的速度和内存使用率!

难以置信吗?那让我们直接进入正题吧!让我们来看一个例子。如下。

type BadStruct struct {
    age          uint8
    IdCardNumber uint64
    DateOfBirth  uint16
}

type GoodStruct struct {
    age          uint8
    DateOfBirth  uint16
    IdCardNumber uint64
}

在上面的例子中,我们定义了两个具有相同字段的结构体。接下来让我们编写一个简单的程序来输出他们的内存使用情况。点击此处您可以获取测试代码。

Bad struct is 24 bytes long
Good struct is 16 bytes long

如您所见,它们占用的内存不同。

到底发生了什么,导致两个字段相同的结构体消耗不同的字节?

答案是数据在操作系统中的内存排列方式。换句话说,数据结构对齐。

CPU 以字长的方式读取数据,而不是通过字节大小。64 位操作系统中一个字长为 8 个字节,而 32 位操作系统中一个字长为 4 个字节。换句话说,CPU 以字长的倍数读取地址。

ype JadStruct struct.png

在 64 位操作系统中,为了获取变量 IdCardNumber,我们的 CPU 需要两个周期来访问数据,而不是一个周期。

第一个周期将获取到 0 到 7 的内存,其余周期获取其余部分。

把它想象成一个笔记本,每页只能存储一个字大小的数据,此时是 8 个字节。如果 IdCardNumber 分散在两个页面上,则需要翻页两次才能检索完整的数据。

这是低效的。

因此我们需要对齐数据结构 -- 将数据存储在一个地址等于数据大小的倍数的位置。

例如,一个 2 字节的数据可以存储在内存 0、2 或 4 中,而一个 4 字节的数据可以存储在内存 0、4 或 8 中。

ype BadStruct struct〈.png

通过简单的对齐数据,确保 IdCardNumber 可以在同一个 CPU 周期内检索到变量。

填充是实现数据对齐的关键。操作系统在数据结构之间用额外的字节填充数据以对齐它们。这就是额外内存的来源!

让我们再来看一看 BadStructGoodStruct

image.png

GoodStruct 消耗更少的内存,仅仅是因为它比 BadStruct 有更好的结构体字段顺序。

由于填充,两个数据结构分别变成了 16 字节和 24 字节。

所以,您只需重新排序结构体中的字段,就可以节省额外的内存!

最后,让我们来做一个简单你的基准测试来证明它在速度和内存的区别,结果如下。点击此处您可以获取可运行的代码。

image.png

从结果您可以看出,遍历 GoodStruct 花费的时间确实更少。重新排序结构体字段可以提高程序的内存使用率和速度。

本篇博客带您了解了简单的数据对齐技术,重新排序结构体中你的字段吧!
数据结构的深思熟虑的对齐真的得到了回报。

目录
相关文章
|
9月前
|
监控 Linux Windows
装备神器edex-ui别人以为我很屌其实我只会if和else搬运代码
装备神器edex-ui别人以为我很屌其实我只会if和else搬运代码
90 1
|
存储 编解码 数据处理
还在为搞不懂笔记本电脑参数而苦恼么?一篇文章就够啦
还在为搞不懂笔记本电脑参数而苦恼么?一篇文章就够啦
315 4
|
Java 程序员 开发者
只用一行代码,你能玩出什么花样?
只用一行代码,你能玩出什么花样?
108 1
|
C语言
无敌!我用【C语言】手搓出了一个体系完整的【员工管理系统】还能玩游戏听音乐?(超详细,附完整源码)
前言:员工管理系统是一款面向公司管理员的管理工具,旨在提供员工信息管理、薪资管理、员工绩效评估、员工福利管理和智能推荐等功能,帮助公司管理员更好地管理员工信息和提高员工工作效率。 这是总体设计大概模型图:
159 0
|
C语言
我读书少,你们得帮帮我
我读书少,你们得帮帮我
|
监控 前端开发 关系型数据库
Zabbix套路深,字符集路更滑,大型翻车现场救援过程分享。
Zabbix套路深,字符集路更滑,大型翻车现场救援过程分享。
149 0
|
机器学习/深度学习 编解码 人工智能
「黑悟空」实机演示炸裂登场(2)
「黑悟空」实机演示炸裂登场
342 0
|
存储 缓存 负载均衡
10大高性能开发宝石,我要消灭一半程序员!
10大高性能开发宝石,我要消灭一半程序员!
157 0
10大高性能开发宝石,我要消灭一半程序员!
|
弹性计算 安全 Linux
一名大一在读生的CS使用体验
一名大一在读生的CS使用体验
|
传感器
和12岁小同志搞创客开发:检测按键状态的两件法宝
和12岁小同志搞创客开发:检测按键状态的两件法宝
和12岁小同志搞创客开发:检测按键状态的两件法宝