zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

探索未对齐内存CPU的访问逻辑

内存逻辑CPU 探索 访问 对齐
2023-09-27 14:19:56 时间

目录

 问题:

数据在内存的存储

CPU的访问

总结:


问题:

如下结构体在未对齐的情况下,读取数据时CPU需要对成员变量i进行两次访问才能完全读取其中数据。

struct text
{
	char c;
	int i;
};
struct text a;

 基于32位平台,CPU每次访问4个字节

为什么不能在取变量i的数据时直接从偏移量为1的位置直接开始读取呢?

这是由于计算机CPU和计算机数据存储的特点造成的,而且这个问题在硬件上大多数是没有办法有效处理。(我对硬件不熟悉,因为遇到了问题所以查资料解决一下,这里只谈实现过程)

数据在内存的存储

        计算机中数据存储在内存中,而内存以硬件的形式出现,表现为不同的内存块,比如内存0有它自己的一块空间,还有内存1、内存2、内存3这些不同的内存块。这些内存的访问顺序又是对应偏移量走的,看下图:

       CPU每次访问都是以偏移量访问的,每次读取4个字节,首先从偏移量为0的内存开始,之后是1,依次往后。

CPU的访问

让我们回到之前的问题,结构体中成员变量c的数据存在0x0地址处,成员变量i的数据存储在0x1、0x2、0x3、0x4地址处,此时变量i的存储范围以经到了偏移量为1的地址处。

CPU首先访问偏移量为0的四个地址,取出i变量i的三个字节。

CPU其次访问偏移量为1的四个地址,取出i变量的一个字节。

总共访问两次。

如果是在对齐的情况下

地址0x0处存放变量 c 的数据   ——  访问偏移量为0的四个地址一次取出数据

地址0x4、0x5、0x6、0x7存放变量 i 的数据  ——  访问偏移量为1的四个地址一次取出数据

总结:

       虽然内存的对齐浪费掉了一些空间,但它的执行速度得以提升。在计算机内存大小持续上涨的今天,浪费掉的内存和所换取的时间相比,是可以接受的。

查阅文献:performance - Why misaligned address access incur 2 or more accesses? - Stack Overflow