您现在的位置是：首页 > 其他

当前栏目

【逆向】x64程序逆向基础——调用约定和栈使用

基础程序调用逆向 X64 约定使用

2023-09-14 09:11:45 时间

【逆向】x64程序逆向基础

主要区别

1. 所有地址指针都是64位。
2. 增加和扩展新的寄存器，并兼容原32位版本的通用寄存器。
3. 原指令指针寄存器EIP扩展为RIP。

寄存器

1. 64位寄存器兼容原32位寄存器。
2. 新增加8个XMM寄存器(XMM8-XMM15)。
3. 扩展原32位寄存器的64位版本，并增加8个新的64位寄存器(R8-R15)。

// 通用寄存器：RAX(64位)，EAX(32位)，AX(16位)，AL(0-7位)，AH(8-15位)
// 新增寄存器：R8(64位)，R8D(32位)，R8W(16位)，R8B(8位)

调用约定

1. x86使用stdcall、cdecl、Fastcall等。
2. x64使用类似“Fastcall”的调用约定。
使用RCX、RDX、R8、R9寄存器传递前4个参数，其余参数从右往左依次保存在栈上。
3. 浮点参数使用XMM寄存器传递（XMM0-XMM3）。
4. 任何在函数开头的mov指令都是在保存被传递到这个函数的参数，编译器不会再其中插入做其它事情的mov指令。

1 mov dword ptr [rsp+28h] ,6     //参数6 保存在栈中
2 mov dword ptr [rsp+20h] ,5     //参数5 保存在栈中
3 mov r9d ,4                     //参数4 保存在寄存器中
4 mov r8d ,3                     //参数3 保存在寄存器中
5 mov edx ,2                     //参数2 保存在寄存器中
6 mov ecx ,1                     //参数1 保存在寄存器中
7 call Fun                       //调用函数

栈使用

1. 32位代码在函数中使用push和pop等指令改变栈的大小。
2. 64位代码在函数中从不改变栈的大小，栈在函数的开始增长，期间一直保持不变，直到函数末尾。
3. 当一个函数调用另一个函数时，调用函数会多申请32字节(0x20)的预留栈空间，当被调用函数寄存器不够用时，可以将4个参数寄存器(RCX、RDX、R8、R9)中的值保存在申请的预留栈空间中。
预留栈空间由函数调用者提前申请，也由函数调用者负责平衡回收。
注意：如果一个函数有其他参数(>4个)或局部栈变量，函数会在0x20的基础上增加预留栈空间的大小，有时增加大小后的值需要与16进行对齐。

示例代码

 1 #include "stdafx.h"
 2 
 3 // Add
 4 int Add(int nl, int n2, int n3, int n4, int n5, int n6)
 5 {
 6     return nl+n2+n3+n4+n5+n6;
 7 }
 8 
 9 // Main
10 int tmain(int argc, TCHAR* argv[])
11 {
12     printf("%d\r\n", Add(1,2,3,4,5,6));
13     return 0;
14 }

Main函数反汇编

 1 // 保存Main函数参数到预留栈空间，此预留栈空间为其它函数调用Main函数时申请
 2 mov[rsp+10h], rdx            // 将参数2保存到预留栈空间中
 3 mov[rsp+8h], ecx             // 将参数1保存到预留栈空间中
 4 
 5 // Main函数作为调用者申请预留栈空间，用于保存Add函数的参数
 6 push rdi                     // 保存环境
 7 sub rsp, 30h                 // 申请预留栈空间(Add函数6个参数)(6*8=48 0x30)
 8 mov rdi, rsp                 // 将栈空间初始化为0xcC
 9 mov ecx, 0Ch
10 mov eax, 0CCCCCCCCh
11 rep stosd
12 
13 // 调用Add函数，前4个参数使用寄存器，其余参数入栈
14 mov ecx, [rsp+40h]
15 mov dword ptr [rsp+28h], 6   // 参数6入栈
16 mov dword ptr [rsp+20h], 5   // 参数5入栈
17 mov r9d, 4                   // 参数4
18 mov r8d, 3                   // 参数3
19 mov edx, 2                   // 参数2
20 mov ecx, 1                   // 参数1
21 cal1 Add                     // 调用Add函数
22 
23 // 调用pirntf函数
24 mov edx, eax                 // 将返回值保存到edx中
25 lea rcx, Format              // "%d\r\n"
26 cal1 printf                  // 调用pirntf函数
27 xor eax, eax                 // 设置返回值
28 
29 // Main函数作为调用者释放预留栈空间
30 add rsp, 30h                 // 释放预留栈空间+2个参数的栈空间(Add参数5，6)
31 pop rdi                      // 恢复环境
32 retn                         // 函数返回

Add函数反汇编

 1 // 保存Add函数前4个参数到预留栈空间，预留栈空间由Mian函数申请和释放
 2 mov[rsp + 20h], r9d     // 参数4
 3 mov[rsp + 18h], r8d     // 参数3
 4 mov[rsp + 10h], edx     // 参数2
 5 mov[rsp + 08h], ecx     // 参数1
 6 
 7 // Add函数中没有调用其它函数和局部变量，所以没有申请预留栈空间
 8 push rdi             　 // 保存环境
 9 mov eax, [rsp + 18h]    // eax = 参数2
10 mov ecx, [rsp + 10h]    // ecx = 参数1
11 add ecx, eax         　 // ecx = 参数1+参数2
12 mov eax, ecx         　 // eax = ecx
13 
14 // 使用预留栈空间来获取Add函数参数
15 add eax, [rsp + 20h]    // eax+参数3
16 add eax, [rsp + 28h]    // eax+参数4
17 add eax, [rsp + 30h]    // eax+参数5
18 add eax, [rsp + 38h]    // eax+参数6
19 
20 // 再次印证预留栈空间由调用函数(Main函数)释放
21 pop rdi             　  // 恢复环境
22 retn                 　 // 函数返回

注意里面有一个细节：main里调用的时候，

16 mov dword ptr [rsp+20h], 5 // 参数5入栈

而add里取出来的时候，是：

17 add eax, [rsp + 30h]    // eax+参数5

刚好相差了16，理由是call的时候push了RIP，同时在add里有push rdi 所以是8+8=16。

三、x64函数约定

在默认情况下，x64程序使用fastcall函数约定，与大部分32位程序最大的区别就是他的参数并不是通过push来进行传递的，而是默认将前4个参数存放在rcx，rdx，r8，r9中。

图中我们传递是4个int型数值，所以传递的寄存器为低32位寄存器，不难看出，这个x64程序是符合我们上面所说的函数约定的。

但是并不是所有的函数都只会用到不超过4个参数，所以，我们还要考虑有更多参数的情况。

当参数多于4个时，x64程序会将多出来的参数传递给[rsp+0x20],[rsp+0x28]......[rsp+(n+1)*8]

图中的第5个参数传递给了[rsp+0x20]。

有人可能在翻阅资料的时候会看到，有的人说第5个参数是[rsp+28]，这种说法也没错，因为这两种情况观察参数的位置是不同的

如果我们在函数调用处观察参数，第5个参数是[rsp+0x20]，如果我们在函数内部去观察，由于步进call的过程中会push RIP，所以此时的rsp是要-8的，所以第五个参数自然就变成了[rsp+0x28]。

虽然在x64程序中，我们默认的前4个参数是rcx-r9，但是也有例外，如果我们传递的参数是浮点型的话，那么传入浮点数的参数则会使用xmm0-xmm3来代替。

图中的第3个参数，也就是原本的r8的位置，此时已经变成了xmm2，而r8并没有做为参数传递到函数里。也就是说，如果在前4个参数中存在浮点数的话，那么，它所对应的4个通用寄存器则会被xmm寄存器所替代。

现在参数我们已经有个大概的了解了，接下来则是函数的返回值。

之前我们说过，函数的返回值是存放在rax寄存器中的，这一点和32位程序是一样的。

图中的返回值是传递给rax，如果我们返回的是个int型数值的话，那么返回值还是会像32位程序一样传给eax的。

但是这个返回值也会有例外，比如我们要返回一个浮点型的话，那么此时的返回值就会传递给xmm0，在函数执行之后rax就没有用武之地了。

在返回 __m128、 __m128i、 __m128d、float、double时，返回值会传递给xmm0，其他情况则会传递给rax。

四、x64的堆栈

32位的堆栈可以说是初学者的噩梦，很多人在学习堆栈时耗费了大量的时间，这不仅仅是因为堆栈先进后出的抽象概念，同样也是因为32位的函数运行中常常使用push，pop来传递参数和维持堆栈平衡。

x64程序的函数约定可以说是初学者的福音，在汇编代码中没有了满窗口的push、pop、add esp,xxx、sub esp,xxx，这使得堆栈的运算变得格外的简单。

比如图中我们想要分析[rsp+F8]的来源，如果他是作为参数来源于上面的某个CALL中的话，那么我们只需要高亮F8，就可以轻松的找到他所在的CALL，并不需要担心rsp在这个过程中的变化，因为rsp基本上不会改变。很明显，他的来源就在上面的一个call里

这里他作为第三个参数传递到了call里，那么如果他不是来源于某个call里，而是来源于外层的呢？那也很简单，我们直接来到函数头部，计算一下他在函数头部是rsp+？，然后在返回接着去分析就可以了。

比如这里有一个[rsp+90]，他并没有来源于本层调用的某个函数，那么我们只需要在头部进行计算，减去push rdi和sub rsp,60改变的偏移，变成[rsp+0x28]，再减去push RIP的8个字节，就可以得出他来源于外层的[rsp+20]，很明显这是第五个参数

执行到返回后我们会发现这个函数的确有第五个参数，他的来源是r12。

在一些程序中，我们还会发现如下代码

此时的寻址方式并不是以rsp为基地址来传递局部变量和参数，那么如果我们想知道一个rbp+xxxx是局部变量还是参数，就需要到头部去进行一个相对复杂的运算，比如图中的rcx来源rbp-59，虽然我们明知他是一个局部变量(因为前面是lea)，但是我们也要到头部去算一算，-59-5F= -B8，在头部的地址是rsp-B8，也就是说他是一个局部变量。

这种方式看似复杂，其实很简单，因为他不需要去计算头部的push和sub rsp，事实上这些偏移都是相对于头部的RIP的。

类似的代码还有很多种，不过我们如果单纯的去逆向数据的话，不必考虑这些寻址方式，只要能正确的去进行计算就可以了。

猜你喜欢

springMVC框架下JQuery传递并解析Json数据
[WASM] Access WebAssembly Memory Directly from JavaScript
Qt 控制Widget窗体大小方法
atitit software sys 软件技术领域工业体系.docx 目录 1. 技术领域一级大类10大类2 2. 理论与软件设计方法学2 2.1. 计算机原理计算机科学导论2 2.2.
javascript面向对象程序设计
How to kill an `uninterruptible sleep` process
Linux进程间通信之管道(pipe)、命名管道(FIFO)与信号(Signal)
[Javascript AST] 0. Introduction: Write a simple BabelJS plugin
const extern static
js实现 once 方法
MySQL普通索引与唯一索引__mysql中唯一索引和普通索引的用途及区别
ElmentUI全局禁止点击遮罩层关闭el-dialog弹窗、对话框不消失功能、显示弹框时，设置页面滚动条仍然可以滚动
使用Excel导入数据到SAP Cloud for Customer系统
【原创】数据挖掘案例——ReliefF和K-means算法的医学应用
每日一道 LeetCode (32)：验证回文串
Atitit.软件架构高扩展性and兼容性原理与概论实践attilax总结
Win11桌面右下角水印怎么去除？
什么是 serialVersionUID ？序列化对象时必须提供 serialVersionUID 吗？

相关主题

Java基础60问
java基础API
Node.js基础
SHELL 基础篇

zl程序教程