反汇编分析C++的返回值

2024-01-23 08:38
文章标签 分析 c++ 返回值 反汇编

本文主要是介绍反汇编分析C++的返回值,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这几天一直在给同学讲数据结构和算法的题,讲题的过程中突然想到这函数的返回值究竟是存放在哪的,为什么可以通过函数的调用来直接给变量赋值。仔细想想这么多年居然没有深究过这个问题,太不应该,于是今天花了些时间来好好研究了一下这个问题。也跟了一些thread,某些前辈的观点是“不应该动不动就提到寄存器,栈,堆这些较底层的概念。完全可以这样理解:返回值保存在一段临时区域,到下一条语句时,返回值被销毁,所以,如果要继续使用返回值,必须将返回值赋予其他变量。”这确实不假,但是我觉得这位前辈应该是在透彻理解了内在的机理之后才这么说的,我觉得作为学习过程还是应该深究一下。

另有一位前辈说“不大于32位的(返回值)在eax中,64位的在edx + eax中。再大就传指针了。”

那么就拿反汇编代码开刀,验证一下。

(一)  基础知识

在看反汇编代码之前,应该有几点要明确一下:

1.每个进程对应一个Call Stack(调用栈),而CallStack 又由许多Stack Frame(栈帧)组成,对应每个未完成的函数调用,由系统分配。(VC调试中默认是会显示调用栈窗口的,越往栈顶的就是越最近调用的函数,黑色显示的就是还未返回的函数调用)

2.eax, ebx, ecx, edx, esi, edi, ebp, esp等都是X86 汇编语言中CPU上的32位通用寄存器的名称,他们各自的作用如下:

EAX 是累加器(accumulator), 它是很多加法乘法指令的缺省寄存器。

EBX 是基地址(base)寄存器,在内存寻址时存放基地址。

ECX 是计数器(counter),是重复(REP)前缀指令和LOOP指令的内定计数器。

EDX 则一般被用来放整数除法产生的余数。

ESI/EDI分别是源/目标索引寄存器(source/destinationindex),在很多字符串操作指令中,DS:ESI指向源串,而ES:EDI指向目标串。

EBP是基址指针(BASE POINTER),按照习惯,通常用于界定StackFrame(栈帧)。

ESP 是堆栈指针,被形象地称为栈顶指针,堆栈的顶部是地址小的区域,压入堆栈的数据越多,ESP也就越来越小。在32位平台上,每压入一个数据,ESP就减少4字节。

3.windows平台下的Call Stack,从上(高地址)往下(低地址)生长。

(二)代码分析

首先我实验的平台是32位版vs2010,程序为Debug版本。

先试试32位整型的int,C++的实验代码如下:

#include "stdafx.h"
int minus(int a ,int b)
{
int j=2;
return a-b;
}
int _tmain(int argc, _TCHAR* argv[])
{
int i=1;
int c=minus(3,1);
return 0;
}

在return 0处设置断点,或者直接用system(“pause”)也行。

调试运行,可以看到反汇编代码如下:

int minus(int a ,int b)
{
/*step8 再次将EPB压栈,并将ESP的值放入EPB中,此时ESP指向位置5,EPB也指向位置5,这个位置也正是minus()栈帧的底部,同时又是Main()栈帧的顶部*/
01091380 push        ebp 
01091381 mov         ebp,esp 
/*step9 作用同step2。此时EPB位置不变,ESP指向位置6*/
01091383 sub         esp,0CCh 
/*step10 作用同step3。此时EPB位置不变,ESP指向位置7*/
01091389 push        ebx 
0109138A push        esi 
0109138B push        edi 
/*step11 作用同step4。ESP和EPB位置不变*/
0109138C lea         edi,[ebp-0CCh] 
01091392 mov         ecx,33h 
01091397 mov         eax,0CCCCCCCCh 
0109139C rep stos    dword ptres:[edi] 
int j=2;
/*step12 作用同step5。ESP和EPB位置不变*/
0109139E mov         dword ptr [j],2 
return a-b;
/*step13 将参数a的值放入EAX。然后将参数b的值也传入,在EAX中进行减法,结果存放在EXA中。ESP和EPB位置不变*/
010913A5 mov         eax,dword ptr [a] 
010913A8 sub         eax,dword ptr [b] 
}
/*step14 返回过程。将三个寄存器的值弹出,恢复到调用前的状态。并将EBP的值赋给ESP,此时EBP与ESP都指向位置5,也就是释放了从位置6到位置5的预留空间。最后弹出EBP的值,使其恢复到调用minus()前的状态,ret语句进行返回,返回到先前压入栈中的返回地址所指向的地址处。此时EPB指向位置0,ESP指向位置3*/
010913AB pop         edi 
010913AC pop         esi 
010913AD pop         ebx 
010913AE mov         esp,ebp 
010913B0 pop         ebp 
010913B1 ret
int _tmain(int argc, _TCHAR* argv[])
{
/*step1 运行时库的启动函数mainCRTStartup()调用Main(),正式进入主函数,将EPB压栈,再将ESP的值放入EPB中,此时ESP指向位置0,EPB也指向位置0,这个位置也正是的Main()栈帧的底部,同时又是mainCRTStartup()栈帧的顶部*/
010913C0 push        ebp 
010913C1 mov         ebp,esp 
/*step2 将ESP下移0CCh个字节,也就是位置0到位置1之间的空间,这段空间将预留用来存储局部变量,此时ESP指向位置1,EPB指向位置0*/
010913C3 sub         esp,0D8h 
/*step3 将三个寄存器的值压栈,此时ESP指向位置2,EPB指向位置0*/
010913C9 push        ebx 
010913CA push        esi 
010913CB push        edi 
/*step4 首先将位置1的地址放入目标索引寄存器EDI中,stos dwordptr es:[edi]的意思是从累加器EAX传送4个字节(双字),到由EDI作为指针的目的串中,同时修改EDI以指向串中的下一个单元,前面加上rep代表重复执行,执行次数就是ECX寄存器中的值,而36h*4正好等于0D8h,所以以下4句的作用就是将刚刚预留的位置0到位置1之间的空间全部赋值为0CCCCCCCCh ,这其实就是int 3断点,以防止意外访问。ESP和EPB位置不变*/
010913CC lea         edi,[ebp-0D8h] 
010913D2 mov         ecx,36h 
010913D7 mov         eax,0CCCCCCCCh 
010913DC rep stos    dword ptres:[edi] 
int i=1;
/*step5 将1传到局部变量i所在地址中,也就是刚刚预留的那块空间中,i应当是EBP-偏移量的形式。ESP和EPB位置不变*/
010913DE mov         dword ptr [i],1 
int c=minus(3,1);
/*step6 在调用minus()前,按从右到左的顺序将实参压栈。EPB位置不变,ESP指向位置3*/
010913E5 push        1 
010913E7 push        3 
/*step7 调用minus(),并将下一条语句的地址010913EE压栈,作为返回地址。EPB位置不变,ESP指向位置4*/
010913E9 call        minus (10911C7h) 
/*step15 从minus返回。将ESP+8,代表释放前面压入栈中的两个市场(2个4字节),并将EAX中的值(也就是返回值)赋给局部变量c,这里也就证明了当返回值是32位int类型的时候,返回值确实是暂存在EAX中的。EPB指向位置0,ESP指向位置2*/
010913EE add         esp,8 
010913F1 mov         dword ptr [c],eax 
return 0;
/*step16 准备返回0给main函数。先对EAX自身做异或运算,EAX变成0,此时返回值才是真正的不存在了。然后将三个寄存器的值弹出,恢复到mainCRTStartup()调用main()前的状态,接着释放位置1到位置0之间的预留空间。EPB和ESP都指向位置0。再接着通过比较EBP与ESP的值,检查ESP是否正常。不相等则调用ILT+305指向的异常处理函数,使ESP等于EBP。正常的话就直接弹出EBP,结束main()函数,返回mainCRTStartup()函数中继续剩下的操作。*/
010913F4 xor         eax,eax 
}
010913F6 pop         edi 
010913F7 pop         esi 
010913F8 pop         ebx 
010913F9 add         esp,0D8h 
010913FF cmp         ebp,esp 
01091401 call       @ILT+305(__RTC_CheckEsp) (1091136h) 
01091406 mov         esp,ebp 
01091408 pop         ebp 
01091409 ret  

示意图如图:

再试试64位整型的long long,C++的实验代码如下(VC6编译器可能不支持long long):

#include "stdafx.h"
long long minus(long long a , long long b)
{
int j=2;
return a-b;
}
int _tmain(int argc, _TCHAR* argv[])
{
int i=1;
long long c=minus(3,1);
return 0;
}

反汇编代码如下:

long long minus(long long a ,long long b)
{
01351380 push        ebp 
01351381 mov         ebp,esp 
01351383 sub         esp,0CCh 
01351389 push        ebx 
0135138A push        esi 
0135138B push        edi 
0135138C lea         edi,[ebp-0CCh] 
01351392 mov         ecx,33h 
01351397 mov         eax,0CCCCCCCCh 
0135139C rep stos    dword ptres:[edi] 
int j=2;
0135139E mov         dword ptr [j],2 
return a-b;
<SPAN style="COLOR: #ff0000">013513A5 mov         eax,dword ptr [a] 
013513A8 sub         eax,dword ptr [b] 
013513AB mov         edx,dword ptr[ebp+0Ch] 
013513AE sbb         edx,dword ptr[ebp+14h] </SPAN>
}
013513B1 pop         edi 
013513B2 pop         esi 
013513B3 pop         ebx 
013513B4 mov         esp,ebp 
013513B6 pop         ebp 
013513B7 ret 
int _tmain(int argc, _TCHAR* argv[])
{
013513C0 push        ebp 
013513C1 mov         ebp,esp 
013513C3 sub         esp,0DCh 
013513C9 push        ebx 
013513CA push        esi 
013513CB push        edi 
013513CC lea         edi,[ebp-0DCh] 
013513D2 mov         ecx,37h 
013513D7 mov         eax,0CCCCCCCCh 
013513DC rep stos    dword ptres:[edi] 
int i=1;
013513DE mov         dword ptr [i],1 
long long c=minus(3,1);
013513E5 push        0 
013513E7 push        1 
013513E9 push        0 
013513EB push        3 
013513ED call        minus (13511C2h) 
013513F2 add         esp,10h 
<SPAN style="COLOR: #ff0000">013513F5 mov         dword ptr [c],eax 
013513F8 mov        dword ptr [ebp-14h],edx </SPAN>
return 0;
013513FB xor         eax,eax 
}
013513FD pop         edi 
013513FE pop         esi 
013513FF pop         ebx 
01351400 add         esp,0DCh 
01351406 cmp         ebp,esp 
01351408 call       @ILT+305(__RTC_CheckEsp) (1351136h) 
0135140D mov         esp,ebp 
0135140F pop         ebp 
01351410 ret  

可以发现在进行减法运算和传递返回值时确实发生了变化,说明返回值为64位整型时,会使用EAX和EDX来分别传递返回值的低32位和高32位。

浮点数的情况就不重复贴代码了,直接看反汇编代码:

float c=minus(3,1);
010E13F5 push        ecx 
//压入实参1到浮点寄存器st(0),注意这个操作不会影响ESP的值
010E13F6 fld1 
//将1送入到ESP指向的空间中,也就是ECX中?并且1从st(0)出栈
010E13F8 fstp        dword ptr [esp] 
010E13FB push        ecx 
//另一个实参3
010E13FC fld         dword ptr[__real@40400000 (10E573Ch)] 
010E1402 fstp        dword ptr [esp] 
010E1405 call        minus (10E117Ch) 
010E140A add         esp,8 
//返回值赋给c,然后出栈
010E140D fstp        dword ptr [c]  

可以看出浮点类型的返回值是暂存在浮点寄存器st(0)中的。

 

这篇关于反汇编分析C++的返回值的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/635835

相关文章

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

Springboot中分析SQL性能的两种方式详解

《Springboot中分析SQL性能的两种方式详解》文章介绍了SQL性能分析的两种方式:MyBatis-Plus性能分析插件和p6spy框架,MyBatis-Plus插件配置简单,适用于开发和测试环... 目录SQL性能分析的两种方式:功能介绍实现方式:实现步骤:SQL性能分析的两种方式:功能介绍记录

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

c++中std::placeholders的使用方法

《c++中std::placeholders的使用方法》std::placeholders是C++标准库中的一个工具,用于在函数对象绑定时创建占位符,本文就来详细的介绍一下,具有一定的参考价值,感兴... 目录1. 基本概念2. 使用场景3. 示例示例 1:部分参数绑定示例 2:参数重排序4. 注意事项5.

使用C++将处理后的信号保存为PNG和TIFF格式

《使用C++将处理后的信号保存为PNG和TIFF格式》在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示,C++提供了多种库来处理图像数据,本文将介绍如何使用stb_ima... 目录1. PNG格式保存使用stb_imagephp_write库1.1 安装和包含库1.2 代码解

C++实现封装的顺序表的操作与实践

《C++实现封装的顺序表的操作与实践》在程序设计中,顺序表是一种常见的线性数据结构,通常用于存储具有固定顺序的元素,与链表不同,顺序表中的元素是连续存储的,因此访问速度较快,但插入和删除操作的效率可能... 目录一、顺序表的基本概念二、顺序表类的设计1. 顺序表类的成员变量2. 构造函数和析构函数三、顺序表

使用C++实现单链表的操作与实践

《使用C++实现单链表的操作与实践》在程序设计中,链表是一种常见的数据结构,特别是在动态数据管理、频繁插入和删除元素的场景中,链表相比于数组,具有更高的灵活性和高效性,尤其是在需要频繁修改数据结构的应... 目录一、单链表的基本概念二、单链表类的设计1. 节点的定义2. 链表的类定义三、单链表的操作实现四、