面试官:请说一下如何优化结构体的性能?
使用内存对齐机制优化结构体性能,妙啊!
前言
之前分享过2篇结构体文章:
10秒改struct性能直接提升15%,产品姐姐都夸我好棒 和 Go语言空结构体这3种妙用,你知道吗? 得到了大家的好评。
这篇继续分享进阶内容:
结构体的定义,大家都很熟悉,想要定义出更节省内存空间的结构体,可不是一件简单的事。
我们必须掌握Go的结构体内存对齐机制,才能做出相应的优化:节省内存并提高性能。
先来看个例子
下面定义两个结构体,字段都一样,只是部分字段稍微调整了一下顺序。
但输出的结果却完全不同:一个顺序调整就节省了8个字节,太神奇了。
type BadSt struct {
A int32
B int64
C bool
}
type GoodSt struct {
A int32
C bool
B int64
}
func main() {
bad := BadSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(bad))//输出结果:24
good := GoodSt{A: 10, B: 20, C: false}
fmt.Println(unsafe.Sizeof(good))//输出结果:16
}
为什么bad占用24字节,而good却只占用16字节呢?
想要解开这个问题,我们得先来学习一下内存对齐机制,然后再来进一步分析。
原理讲解
基本概念
为了能让CPU可以更快的存储、读取到各个字段,Go编译器会帮我们把结构体做数据的对齐。
所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便CPU可以一次将该数据从内存中读取出来,减少了读取次数。
编译器通过在结构体的各个字段之间填充一些空白,来达到对齐的目的。
CPU访问内存
CPU 访问内存时,并不是逐个字节访问,而是以机器字(word)为单位进行访问。
比如 64位CPU的字长(word size)为8bytes,那么CPU访问内存的单位也是8字节,每次加载的内存数据也是固定的若干字长,如8words(64bytes)、16words(128bytes)等
对齐系数
不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默认"对齐系数",32位系统对齐系数是4,64位系统对齐系数是8
不同类型的对齐系数也可能不一样,使用Go
语言中的unsafe.Alignof
函数可以返回相应类型的对齐系数,对齐系数都符合2^n
这个规律,最大也不会超过8
func main() {
fmt.Printf("bool: %d
", unsafe.Alignof(bool(true)))
fmt.Printf("string: %d
", unsafe.Alignof(string("a")))
fmt.Printf("int: %d
", unsafe.Alignof(int(0)))
fmt.Printf("int32: %d
", unsafe.Alignof(int32(0)))
fmt.Printf("int64: %d
", unsafe.Alignof(int64(0)))
fmt.Printf("float64: %d
", unsafe.Alignof(float64(0)))
fmt.Printf("float32:%d
", unsafe.Alignof(float32(0)))
}
//输出结果:
//bool: 1
//string: 8
//int: 8
//int32: 4
//int64: 8
//float64:8
//float32:4
对齐原则
- 结构体变量中成员的偏移量必须是成员大小的整数倍
- 整个结构体的内存大小必须是最大字节的整数倍(结构体的内存占用是1/4/8/16byte…)
案例分析
type BadSt struct {
A int32
B int64
C bool
}
BadSt结构体,占用24个字节
分析过程:
- 字段A 4字节:先计算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
- 字段B 8字节:下标4-7,对8都不能整除,则填充空白,下标8可以整除,所以下标8-15 8个字节为字段B的存储使用;
- 字段C 1字节:下标16,对1可以整除,所以下标16则用作字段C的存储;
- 最后,该结构体字段最大字节为8且目前已占用17字节,要保证是整数倍,所以最后面需要填充7个字节,占满24字节,才能满足条件(对齐原则2)。
GoodSt结构体,占用16个字节
type GoodSt struct {
A int32
C bool
B int64
}
分析过程:
- 字段A 4字节:先计算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
- 字段C 1字节:下标4,对1可以整除,所以下标4则用作字段C的存储;
- 字段B 8字节:下标5-7,对8都不能整除,则填充空白,下标8可以整除,所以下标8-15 8个字节为字段B的存储使用;
- 最后,该结构体字段最大字节为8且目前已占用16字节,正好是整数倍,所以后面不再需要填充空白了。
总结
通过上文的原理讲解和案例分析,我们发现内存对齐机制并不复杂。
可以简单理解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。
掌握了内存对齐机制后,结构体Struct的优化,调整下字段顺序,效果立竿见影。内存对齐其实就是典型的空间换时间的方式,来达到优化的目的。牢记对齐原则,对实际场景进行分析,减少空白填充。
原文链接:https://mp.weixin.qq.com/s/64eWxeB0xxA65HZc65axHQ
一起学习
需要简历优化和就业辅导的朋友可以私信我,也欢迎关注我的公众号:
我的文章首发在我的公众号: 程序员升职加薪之旅,欢迎大家关注,第一时间阅读我的文章。
也欢迎大家关注我,点赞、留言、转发。你的支持,是我更文的最大动力!
相关文章
- 315曝光全名单:互联网野蛮行为该结束了
- 核心技术人员梁军离职,寒武纪市值蒸发60亿
- 俄罗斯发起反击,正式宣布全面封禁Instagram,当地IP已无法访问
- 单目深度估计方法综述
- 仿生人能骑电子羊了!全球首款四足机器羊:小姐姐坐着有点颠
- 2010年以来,ML算力需求增长100亿,6个月翻番,深度学习成分水岭
- [当人工智能遇上安全] 5.基于机器学习算法的主机恶意代码识别研究
- 三大运营商2021年业绩报告:营收利润双提速5G释放新动能
- 腾讯裁员比例辟谣、寒武纪核心技术人员梁军离职、知乎2021年净亏损12.99亿元 | T资讯
- 被一众科技巨头“锁喉”,俄罗斯:勿cue,已有准备
- [AI安全论文] 08.基于溯源图的APT攻击检测安全顶会论文总结
- T资讯:俄罗斯正式封禁Instagram;中国移动回应通信行程卡崩了;消息称腾讯阿里将大规模裁员
- 为什么俄罗斯不怕芯片卡脖子?
- 俄罗斯将禁止 Instagram 在其境内运行
- 单个神经元通过预测未来活动来学习,有助于解释大脑是如何工作的
- 亚一纳米制程晶体管,一个碳原子栅极厚度:清华重大突破登上Nature
- 千人规模元宇宙技术峰会转至线上,免费报名通道现已开启!
- 华为天才少年稚晖君自制硬萌机器人,开源五小时,GitHub收获317星
- 日本CG大神又整活了!3D建模软件拿来搞面部实时捕捉
- 单张GPU搞定GPT-3超参数!先训练小模型,再“一键迁移”