zl程序教程

您现在的位置是:首页 >  后端

当前栏目

抽丝剥茧C语言(中阶)函数栈帧的创建与销毁——图解

C语言图解 函数 创建 销毁 抽丝剥茧 栈帧 中阶
2023-06-13 09:17:43 时间

函数栈帧的创建与销毁

导语

这篇文章是从头贯穿到尾的,让你更加详细的了解函数是什么样在内存里创建,怎么样销毁的,相信家人们读完这篇文章之后能让你眼里的代码变得透明起来(本章不需要过多了解汇编语言,重点是了解函数栈帧怎么创建和销毁的) 注意:这里我们用的是32位平台,用VS2013作为参考。

问题

大家知道这些是为什么吗?

看完这一篇,这些问题将迎刃而解。

寄存器

寄存器:

eax 通常用来执行加法,函数调用的返回值一般也放在这里面 ebx 通常用来数据存取 ecx 通常用作for循环的计数器 edx 读取I/O端口时,存放端口号 edi 字符串操作时,用于存放目的地址的,和esi两个经常搭配一起使用,执行字符串的复制等操作

今天主要的是:

ebp 栈底指针,指向栈的底部,用ebp+偏移量的形式来定位函数存放在栈中的局部变量 esp 栈顶指针,指向栈的顶部 这两个寄存器用来存放地址用来维护函数栈帧

函数栈帧

函数栈帧是什么?

C语言中,每个栈帧对应着一个未运行完的函数。栈帧中保存了该函数的返回地址和局部变量。(来自百度百科)。

内存分布

栈区:由高地址往低地址增长,主要用来存放局部变量,函数调用开辟的空间,与堆共享一段空间。(本篇重点) 堆区:由地地址向高地址增长,动态开辟的空间就在这里(malloc,realloc,calloc,free),与栈共享一段空间。 静态区:主要存放全局变量和静态变量。

什么是栈?

栈(stack)又名堆栈,它是一种运算受限的线性表。限定仅在表尾进行插入和删除操作的线性表。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压栈,它是把新元素放到栈顶元素的上面,使之成为新的栈顶元素;从一个栈删除元素又称作出栈或退栈,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。(来自百度百科) 这里面有更详细的链接: .

详细讲解函数栈帧

栈帧的维护

这里我们用一段代码演示:

#include <stdio.h>
int Add(int x,int y)
{
	int z = x + y;
	return z;
}
int main()
{
	int a = 10;
	int b = 20;
	int c = 0;

	c = Add(a, b);

	printf("%d\n", c);
	return 0;
}

这是一个很简单加法逻辑。 我们首先要分配main函数的地址,栈帧使用是先从高地址再到低地址。

假设我们main函数是存入在这个地方。 当然,这个地址没有申请之前不是你的,我们需要两个寄存器维护main的这块空间。 它们就是我们之前介绍的esp和ebp:

esp和ebp中间的空间就是main函数的空间,它俩是维护函数栈帧的,调用哪个就去维护哪个函数栈帧。 这时我们在编译器里按下F10,点击调试,移动到窗口,然后点击监视,内存,反汇编。 这时我们接下来需要的三个窗口,有助于理解。 反汇编那里我们逐步分析: 首先我们要知道main函数也是被调用的(不做过多了解),调用main函数的函数一开始是被esp和ebp维护的。

开辟main函数

然后我们去看反汇编那里的指令:

push 的指令是压栈,也就是给栈放了一个元素进去,这里是把epb的值放了进去。

结果就是这个样子,我们发现,esp调到上面去了,这是因为esp的性质。 我们用调试里面的内存和监视看一看:

这是原来esp的地址:

这是第一行汇编运行后的:

我们知道地址是从高到低使用,esp向上面移动了,也就是代表地址要变小,这里减少了4。 我们再看看内存里:

确实压进去了。 第二行的指令是什么意思呢?

把esp的值给ebp(注意,esp和ebp为指针,它们里面储存的是地址)

也就是说ebp不会指向原来的位置了,和esp指向相同的位置。

变成了这个样子。 第三行指令是做什么呢?

这里只给esp减去0E4h这个值,这个值是十六进制的数字,转换十进制为228。(至于后面的h我们不做详细的讲解)

也就是说我们的esp移到了上面的某一个位置去了。

也就是说我们的esp和ebp再一次的维护了一块空间,这块空间就是我们main函数的空间。

然后下面的三行汇编指令就是压栈:

值如下:

然后是后面的指令:

第一行是把[ebp-24h]这个值给edi。 第二行把39h放在ecx里面。 第三行把0CCCCCCCCh的内容放在eax里面。 第四行是从edi开始往下的ecx空间里面放eax的值。(dword是四个字节的意思)

我们发现,edi是esp原来指向的位置,也就是这个位置:

最后面的地址我们发现是ebp的地址:

至于edi为什么地址变了,这个我们不做深究,只需要看[ebp-0E4h]的地址就可以了,因为这是没变之前edi的地址。 这里我们也发现,main函数里面都放满了0CCCCCCCCh这个值。 (这也能解释我们在打印字符数组的时候没有\0会打出来一堆乱码,因为里面都是随机值,也就是你放进去的0CCCCCCCCh。)

也就是说我们在main函数的区域里初始化了上面的蓝色值。 上面只是为main函数栈帧的开辟。

创建局部变量与初始化

现在初始化三个值:

我们看第一条指令,最后面的0Ah是十六进制,代表10的意思,把10放进[ebp-8]这个地址里面:

看,我们里面CCCCCCCC的值被改成, 十六进制a也就是十进制的10。 那么下面的两条汇编指令也就容易易理解了,最后变成这个样子:

这里顺便说一句,因为esp的上移,main函数的栈区已经变成了这样。 这里就是局部变量的创建与初始化。

调用Add函数

现在我们应该调用Add函数了。

首先分析第一条指令,我们要把[ebp-14h]的地址存进eax的寄存器里,然后往下看,再进行压栈。

其实也就是把我们的20存进eax,10存进了ecx而已。

我们又把eax和ecx进行压栈,其实也就是把20和10放再了上面。 这个动作其实就是传参。 然后看下一行的指令call,这是准备调用Add函数,这是到了call这一行时,按F11进入这个函数内部,在进入内部之前我们发现这么一个问题:

红色是变化的一行,这里存入的地址是不是很眼熟?没错就是call下面add的地址。 这个位置是在我们传参上面的位置,也就是说再一次进行了压栈。

为什么要把地址放再这个地方呢?因为我们都知道,函数调用之后都是需要返回的,在这里记住地址就好从这里返回,然后继续执行指令。

Add函数的内部

这是进入Add函数里面的汇编指令:

是不是看着似曾相识?没错就是给Add函数分配空间并且维护。 在正式说这段代码我要说一句,现在维护代码的两个寄存器已经移动很多次了,也就是说现在main函数的栈帧已经这么大了:

我们再看现在需要的指令:让我们把ebp进行压栈,这里的ebp其实是main函数的ebp地址。 这些指令就和之前开辟main函数一样的逻辑:

这就是Add函数的栈帧。 下面进行局部变量的创建和计算加法还有返回值:

第一行指令先创建整型变量Z初始化为0:

然后看第二行指令,把[ebp+8]放进eax里面。 第三行指令,把[ebp+8]的值和[ebp+0Ch]加起来放在eax里面。

这时,eax等于30。 然后看第四行指令,意思是把eax的值放在[ebp-8]这个地址里面。 这里我们就明白了,是这样调用参数然后把他们放进了Z里面。 到了这里我们也明白了一件事,之前说的形参和实参问题,其实ecx和eax里面是10和20这个数值,并不像之前的ebp一样存的是地址,也就是说这里的ecx和eax有单独的空间,通过这个空间也只能找到10和20这个数值而已。 并且我们接收的值是int x和int y都没显示怎么运作。 Add的返回: 现在到返回了,我们也有一个疑惑,局部变量Z出了Add函数不就已经销毁了吗?其实是这样的,看最后一行,我们把[ebp-8]这个地址的值暂时存在了eax这个寄存器里,虽然变量Z销毁了,但是寄存器eax是不会销毁的,它是集成在CUP的硬件,所以说寄存器带着Z的值就走了。

返回与销毁

让我们看接下来的指令:

这里的pop是什么意思呢?是弹出的意思,连续三个弹出,把edi,esi,ebx都弹出去了:

变成了这个样子,esp因为这三个元素的弹出从而变化。 然后继续看第四行的指令,把ebp的地址赋给esp,也就是说esp拿到了现在的ebp的地址,和ebp同时指向了一个地方:

第五行的指令是弹出ebp(也就是main函数的ebp原来的地址),把弹出的结果弹到指向这里的ebp里面,就等于把原来再main函数的ebp地址赋给了现在指向这里的ebp,然后esp增加了一个4个字节的地址:

现在我们就发现,已经都回到了main函数的栈帧里面,esp和ebp又开始维护main函数了。 我们还有一个是ret指令,这个指令是返回的意思,弹出当前这个函数从栈顶返回。 因为之前我们存了00C21450这个地址,那么落脚点就是这个地址。

左边黄色箭头的地方就是落脚点。(当时存这个地址就是为了能让我们返回main函数里面的这一行) 这里注意,ret完事之后会pop一下,也就是说把这个main栈帧的最上面的元素给弹出了(也就是00C21450这个地址)。 add这一行的意思是给esp+8,就等于弹出了这两个元素(ecx和eax),形参也就销毁了:

这是图解。 我们继续往下看:

黄色箭头指向的地方指令是什么意思?把eax的值赋给[ebp-20h](这个地址就是局部变量C的地址)eax是个寄存器,之前我们把变量Z的值放了进来,也就是说我们最后把变量Z放进了变量C里面。 这样我们就把返回值给带回来了。

至于printf打印这些指令我们不做讲解了。 剩下的main函数的销毁和之前add的销毁一样。

结束

到这里函数栈帧与销毁就讲完了,我相信大家对于上面的疑惑都有了答案。