[Linux] 理解CPU缓存的伪共享问题
2023-02-18 15:37:15 时间
CPU是有高速缓存的 , 三级缓存分别是 L1 , L2 , L3
L1缓存最贴近CPU , 所以速度也最快
数据在缓存中是一行一行存储的 , L1缓存一般的一行缓存64字节
一行能缓存64个字节 , 因为一个变量可能没有64字节大小 , 所以可能会缓存好几个变量
缓存需要保证一致性, 也就是当变量修改的时候 , 缓存必须得失效 , 重新在内存中读取变量加载到缓存里
当一行里有好几个变量的时候 , 其中一个变量修改了 , 这一行的数据都得失效
并且同一时间只允许一个线程操作缓存行 ,
当并发比较高修改比较频繁时候 , 缓存的性能就下降了很多 , 这就是伪共享问题
一般解决这个问题是用的内存对齐填充来解决 , 也就是我一个变量占满这一行64字节 , 当然这样也比较浪费缓存
我们常说的局部性原理也与CPU缓存有关 ,
当我们使用数组的时候 , 内存地址是连续的 , 这样就很有可能放在一行里 , 每次CPU从缓存里读一行就能读到相邻的变量 , 速度会很快
相关文章
- MongoDB 在评论中台的实践
- 使用mongodb作为Quartz.Net下的JobStore实现底层的持久化机制
- mongodb之使用explain和hint性能分析和优化
- mongodb 3.x 之实用新功能窥看[2] ——使用$lookup做多表关联处理
- mongodb 3.x 之实用新功能窥看[1] ——使用TTLIndex做Cache处理
- 双十一来了,别让你的mongodb宕机了
- GO语言开发环境搭建笔记
- PHP判断网络连通
- 开启phpMyAdmin的远程登录
- PHP_cURL初始化和执行方法
- PHP经典函数收集
- PHP所有函数列表
- php bbcode过滤
- php不使用中间变量交换两个变量的值
- 嵌入式:ARM异常中断指令SWI、BKPT、CLZ详解
- 嵌入式:ARM协处理器指令总结
- C++ 中的卷积神经网络 (CNN)
- 一个git仓库多个项目配置pre-commit代码校验
- 搭建PHP开发环境(PHPStorm+PHPStudy)
- 记一次git丢失代码找回