C语言杂谈:函数栈帧,函数调用时到底发生了什么

2024-06-06 19:28

本文主要是介绍C语言杂谈:函数栈帧,函数调用时到底发生了什么,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        我们都知道在调用函数时,要为函数在栈上开辟空间,函数后续内容都会在栈帧空间中保存,如非静态局部变量,返回值等。这段空间就叫栈帧

        当函数调用,就会开辟栈帧空间,函数返回时,栈帧空间就会被释放。这里的释放并非清空,而是让其无效化,可以后续的使用。

1,用到的寄存器和汇编指令

1,相关寄存器

eax:保存临时数据,返回值

ebx:保存临时数据

ebp:栈底寄存器

esp:栈顶寄存器

eip:指令寄存器,保存当前指令的下一条指令的地址

2,相关汇编指令

call:函数调用

mov:数据转移

push:出栈指令

pop:入栈指令

sub:减法指令

add:加法指令

jump:修改eip,转入目标函数调用

ret:恢复返回地址

2,虚拟内存地址

除了这些指令和寄存器,我们也需要了解虚拟内存地址是什么样子的

简单来说,高地址向低地址存储的内容分别是:内核,栈(向下增长),共享库的内存映射区域,

堆(向上增长),数据区(未初始化的数据,已初始化的数据),代码区,以及不分配使用的部分

区域。

值得注意的时,栈区是向下增长的,堆区是向上增长的。

3,代码预览

    简单总结调用函数时,发生的行为:

1,先形参实例化,按照参数列表从右向左

2,保护现场//将函数返回地址压入栈,转入目标函数

3,执行函数体

4,释放局部变量的栈帧空间

5,恢复现场//获得函数返回地址,释放栈帧空间

6,继续后续主函数语句
 

下面是演示所用的c语言代码

#include<stdio.h>
int add(int a,int b)
{return a+b;    
}
int main()
{int a=10;int b=10;int c=0;c=add(a,b);return 0;
}

4,调用过程

使用vs2022,点击调试,打开反汇编,打开寄存器

A:主函数栈帧建立

首先我们要知道,主函数也是函数,也需要建立函数栈帧,它被_tmainCRTStartup函数调用,而_tmainCRTStartup又被mainCRTStartup函数调用,mainCRTStartup函数又是被操作系统所调用的。

00007FF7AD0618D0  push        rbp  
00007FF7AD0618D2  push        rdi  
00007FF7AD0618D3  sub         rsp,148h  
00007FF7AD0618DA  lea         rbp,[rsp+20h]  
00007FF7AD0618DF  lea         rcx,[__B782E998_栈帧@c (07FF7AD071008h)]  
00007FF7AD0618E6  call        __CheckForDebuggerJustMyCode (07FF7AD061370h)  

这些是主函数栈帧建立的汇编代码

我们暂且不管这些代码,去关注寄存器的变化,重点关注espebp寄存器

这是主函数栈帧建立前栈底寄存器和栈顶寄存器的位置

这是主函数栈帧建立后栈底寄存器和栈顶寄存器的位置

可以看到栈顶寄存器的数值减少了(D20-C2C)个字节,这就说明了我们栈是由高地址向低地址增长

的,具体的建立过程我们在add函数时介绍。

B:变量初始化

单击F10我们观察寄存器

EIP指向下一条要指向的指令地址,值为00C71985,正是int a=10;这条指令。

此时,栈内空间应该是这样的:

点击F10,将变量a入栈,因为栈是从低地址到高地址增加的,所以我们将内存监视器调到010FF778,观察前后变化。

点击前

点击后

我们可以发现,变量a成功入栈了,距离栈底寄存器所在位置向上偏移八个字节单位

,同理我们将变量b和c入栈

观察到同样入栈成功,这里变量b也是0a的原因是因为数值相同,编译器进行了处理。

现在主函数栈帧就添加了三个变量。

接下来就是调用函数给c赋值了,一共有七条指令,我们一个个来看。

首先是调用Add()前(即call指令前)的4条指令,我们可以看出前两条指令的作用是先将变量b的值移

动到eax寄存器,然后以压栈push的方式压入栈中,栈顶寄存器更新,先下增长。

这里两个临时变量的产生,就是我们所说的形参实例化。我们需要注意两个点,一个是这是在调用

函数前生成的,其次就是压栈顺序是形参列表从右向左。

接下来,我们将执行函数调用指令,因为我们是通过跳转指令修改eip寄存器转入目标函数地址,

Add函数调用结束后还需返回main函数执行后续代码,所以我们需要将下一条指令的地址先保存起

来,然后进行跳转。

因此这个指令分为两步:1.将返回地址压入栈中 2.转入目标函数。

点击F11进入函数,我们可以发现函数返回后的指令地址被压入栈中(010FF67C ),然后修改eip进行跳转,转入add()函数:

C:转入add函数

下面三条是栈帧建立过程

 首先是第一条指令,单击F10,将栈底寄存器的内容压入栈中,即把main函数栈底的地址压入栈中:

因为是压栈,所以栈顶寄存器向上偏移四个字节。

然后是第二条指令,单击F10,将栈顶寄存器的内容移动到栈底寄存器,使得栈顶寄存器和栈底寄存器指向同一个地址空间:

 最后是第三条指令,单击F10,将esp栈顶寄存器的内容减去0CCH,使其向低地址偏移0C0h个字节,如下:

至此,add函数栈帧建立完成。

建立的栈帧空间

之后的内容我们在之前都有过类似的,我们需要知道几点

1,retnru语句计算时,函数参数是从之前的临时变量处取得数值进行计算

2,计算结果存储在eax寄存器中

至此,ADD函数调用完毕,进入最后一步,栈帧释放。

D:add函数销毁

栈帧的销毁我们重点来谈后三条语句,前几条语句对应着前面栈帧创建时的初始化操作,进行设置,我们不去管。

首先是第一条mov命令,我们单击F10运行,ebp栈底寄存器的值赋给esp栈顶寄存器,此时ebp与esp指向同一个地址空间: 

在这时,理论来说我们就已经释放完成了,因为add函数的内存空间已经被覆盖了。

接下来就是恢复main函数栈帧的操作了。

        我们单击F10,执行下一条pop指令,将栈顶内容弹出并放入ebp栈底寄存器中,还记得我们

刚才栈顶放的是什么了吗,是main函数栈底地址,所以此时ebp重新指向main函数栈底。

同时esp栈顶寄存器的指向发生改变。

        之后执行ret指令,ret作用是恢复返回地址,压入eip,即把栈顶元素弹出到eip指令寄存器

中,改变下一条执行的指令。我们单击F10,发现返回到了main函数,此时eip的内容就是我们之

前保存的下一条main函数指令地址,esp栈顶寄存器发生改变:

之后执行main函数中的下一条add指令,将esp栈顶寄存器的值加8并存回esp栈顶寄存器,此时esp向下偏移8个字节,指向原main函数栈顶,释放临时变量的栈帧空间。

最后使用mov将值赋给c,打印,函数结束。

后面的printf函数也会建立栈帧,但类似,不再讨论。

这篇关于C语言杂谈:函数栈帧,函数调用时到底发生了什么的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1037018

相关文章

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

C++操作符重载实例(独立函数)

C++操作符重载实例,我们把坐标值CVector的加法进行重载,计算c3=c1+c2时,也就是计算x3=x1+x2,y3=y1+y2,今天我们以独立函数的方式重载操作符+(加号),以下是C++代码: c1802.cpp源代码: D:\YcjWork\CppTour>vim c1802.cpp #include <iostream>using namespace std;/*** 以独立函数

函数式编程思想

我们经常会用到各种各样的编程思想,例如面向过程、面向对象。不过笔者在该博客简单介绍一下函数式编程思想. 如果对函数式编程思想进行概括,就是f(x) = na(x) , y=uf(x)…至于其他的编程思想,可能是y=a(x)+b(x)+c(x)…,也有可能是y=f(x)=f(x)/a + f(x)/b+f(x)/c… 面向过程的指令式编程 面向过程,简单理解就是y=a(x)+b(x)+c(x)

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C语言指针入门 《C语言非常道》

C语言指针入门 《C语言非常道》 作为一个程序员,我接触 C 语言有十年了。有的朋友让我推荐 C 语言的参考书,我不敢乱推荐,尤其是国内作者写的书,往往七拼八凑,漏洞百出。 但是,李忠老师的《C语言非常道》值得一读。对了,李老师有个官网,网址是: 李忠老师官网 最棒的是,有配套的教学视频,可以试看。 试看点这里 接下来言归正传,讲解指针。以下内容很多都参考了李忠老师的《C语言非