动手写汇编——函数调用过程的思考

2024-09-02 01:08

本文主要是介绍动手写汇编——函数调用过程的思考,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

c代码

在linux系统上,动手写一个demo.c小程序

#include <stdio.h>int func0(int a, int b)
{int t;t = a + b;return t;
}int main(void)
{int t;t = func0(10, 20);printf("%d\n", t);return 0;
}

该程序在func0函数中做了加法运算,并通过printf系统调用打印了出来。

gcc demo.c -o demo

./demo 运行之后将在屏幕上打印30。


汇编

加下来,我们可以根据c语言代码执行流程写一个汇编文件demo.S,如下

.global main
PRINTTEXT:.string "%d\n".textfunc0:
/*进入func0堆栈*/
pushl   %ebp
movl   %esp, %ebp
/*预留空间*/
subl    $16, %esp
/*
取出参数10
相当于 movl $10, %eax
*/
movl   8(%ebp), %eax
/*
取出参数20
相当于movl $20, %edx
*/
movl   12(%ebp), %edx
/* 做加法,30赋给了edx */
leal    (%eax, %edx), %eax
/* 将加法的值赋值给t,既放入预留空间的其他空余位置 */
movl   %eax,   -4(%ebp)
/* eax承接了返回值大小 */
movl   -4(%ebp), %eax
/* func0函数出栈 */
leave
retmain:
/* 进入main函数堆栈 */
pushl   %ebp
movl   %esp, %ebp
/* 预留空间,大小调整可根据情况设定 */
subl    $32, %esp
/* 参数入栈,使用的是预留空间 */
movl   $10, (%esp)
movl   $20, 4(%esp)/* 调用func0函数 */
call func0/* 将func0返回值放入变量t,预留空间的其他空余位置 */
movl   %eax, 16(%esp)/* eax和edx承接系统调用printf的两个参数 */
movl   %eax, %edxmovl   $PRINTTEXT, %eax
movl   %eax, (%esp)
movl   %edx, 4(%esp)
call printf/* return 0, 需要提前将返回值0赋给eax */
movl    $0, %eax
/* main函数出栈 */
leave
ret

 

我们可以通过 gcc demo.S -o demo -m32,来完成32位demo例子程序的编译,还可以通过调整demo.S的汇编指令以及数值来观察demo程序运行结果的变化。


一些思考

上述汇编中有详细的注释可供参考,大家可以尝试着自己去写一个汇编,通过自己动手书写汇编程序,我们可以总结出来几个小知识点。

1、堆栈平衡

    网上有好多关于堆栈平衡的知识讲解,可自行百度学习一下。一个函数的调用过程其实堆栈空间和寄存器的配合使用。

    单纯从汇编程序来看,我们发现call指令调用的函数结束之后,我们所接下来使用esp和ebp寄存器就是call指令之前的值,既一个call指令调用完成(函数执行完成),我们的堆栈状态是没有发生任何变化的。

2、关于局部变量

    学习c语言时,我们知道函数中的局部变量的作用域只限定于函数内部,函数体之外无法使用。

    单纯从汇编程序来看,函数内部的局部变量其实是通过修改esp寄存器的值,所预留出来的空间,其预留大小以及每个变量存放的对应位置是由编译器决定的,当然,我们自己动手写汇编的时候可进行调整。当函数执行完成,esp与ebp复位到函数调用之前,函数运行期间所使用的堆栈空间已经不存在了(或许对应地址还有残留值,但已经无法通过正常途径访问和使用)。

3、关于传参

    我们所传递的参数使用的是调用者参数的预留空间,并根据参数从右到左的顺序从高地址向低地址(栈地址空间是从高地址向低地址延伸的)依次放入该空间。预留空间可以当成一个桶,高地址是桶底,低地址是顶部,将需要传递的参数从右到左依次放入桶中,我们可以把这个过程叫做参数压入堆栈。

    当然了,我们自己手写汇编的时候,顺序是可以自己指定的,只要将参数放到预留空间的某位置,并在调用函数中通过偏移ebp寄存器地址取到即可。

4、关于返回值

  • 从手写的汇编程序中可以发现,我们将返回值放到了eax寄存器里面,eax寄存器可以承接返回值,并由调用者来使用。
  • 如果我们返回的是一个结构体呢,eax承接不了这么多数据。这时候会在调用者的预留空间里面预留出来承接返回值的空间,并将承接返回值的空间的起始地址A和参数B、C或者D......依次倒序压入堆栈中。于是我们在堆栈中就可以通过ebp寄存器的固定地址偏移取出来A,并将我们想传递的参数放入到A中即可。
struct t_node
{int value;int time;
};struct t_node func0(int a, int b)
{int t;struct t_node node;node.value = a;node.time = b;return node;
}int main(void)
{int t;struct t_node node;node = func0(10, 20);return 0;
}对应的汇编:subl    $28, %esp/*将预留的返回值空间地址传递给eax*/leal    -12(%ebp), %eaxmovl    $20, 8(%esp)movl    $10, 4(%esp)/*eax值压入堆栈中*/movl    %eax, (%esp)call    func0
  • 如果我们返回的是一个指针变量,既是一个地址值,那就可以将该地址值赋值给eax寄存器,通过eax寄存器传递给调用者。

5、关于函数调用过程

    以函数A的调用为例    

    call  A  ->  enter A stack ->  函数体  ->  leave A stack

  • call A的本质其实是操作了eip/rip指令寄存器,其实相当于  pushl %eip, movl  $A  %eip。
  • enter A stack有固定的套路,基本上就是 pushl %ebp,  movl %esp, %ebp 组合。
  • leave A stack也有固定的套路,基本上就是 leave, ret 组合。其中leave的本质是 movl %ebp, %esp,  popl %ebp,用来做堆栈恢复, 而ret的本质则是将call押入堆栈的eip地址出栈: popl %eip。
  • 而经常用到的入栈操作pushl,以 pushl %ebp为例,其实相当于 subl $4, %esp,  movl %ebp, %esp。
  • 而经常用到的出栈操作popl,以popl %ebp,其实相当于movl %esp, %ebp, addl  $4, %esp。

 

 

 

 

 

 

 

这篇关于动手写汇编——函数调用过程的思考的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1128566

相关文章

浅析Spring Security认证过程

类图 为了方便理解Spring Security认证流程,特意画了如下的类图,包含相关的核心认证类 概述 核心验证器 AuthenticationManager 该对象提供了认证方法的入口,接收一个Authentiaton对象作为参数; public interface AuthenticationManager {Authentication authenticate(Authenti

作业提交过程之HDFSMapReduce

作业提交全过程详解 (1)作业提交 第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。 第2步:Client向RM申请一个作业id。 第3步:RM给Client返回该job资源的提交路径和作业id。 第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。 第5步:Client提交完资源后,向RM申请运行MrAp

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Solr 使用Facet分组过程中与分词的矛盾解决办法

对于一般查询而言  ,  分词和存储都是必要的  .  比如  CPU  类型  ”Intel  酷睿  2  双核  P7570”,  拆分成  ”Intel”,”  酷睿  ”,”P7570”  这样一些关键字并分别索引  ,  可能提供更好的搜索体验  .  但是如果将  CPU  作为 Facet  字段  ,  最好不进行分词  .  这样就造成了矛盾  ,  解决方法

动手学深度学习【数据操作+数据预处理】

import osos.makedirs(os.path.join('.', 'data'), exist_ok=True)data_file = os.path.join('.', 'data', 'house_tiny.csv')with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n') # 列名f.write('NA

Python:豆瓣电影商业数据分析-爬取全数据【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】

**爬取豆瓣电影信息,分析近年电影行业的发展情况** 本文是完整的数据分析展现,代码有完整版,包含豆瓣电影爬取的具体方式【附带爬虫豆瓣,数据处理过程,数据分析,可视化,以及完整PPT报告】   最近MBA在学习《商业数据分析》,大实训作业给了数据要进行数据分析,所以先拿豆瓣电影练练手,网络上爬取豆瓣电影TOP250较多,但对于豆瓣电影全数据的爬取教程很少,所以我自己做一版。 目

笔记整理—内核!启动!—kernel部分(2)从汇编阶段到start_kernel

kernel起始与ENTRY(stext),和uboot一样,都是从汇编阶段开始的,因为对于kernel而言,还没进行栈的维护,所以无法使用c语言。_HEAD定义了后面代码属于段名为.head .text的段。         内核起始部分代码被解压代码调用,前面关于uboot的文章中有提到过(eg:zImage)。uboot启动是无条件的,只要代码的位置对,上电就工作,kern

AutoGen Function Call 函数调用解析(一)

目录 一、AutoGen Function Call 1.1 register_for_llm 注册调用 1.2 register_for_execution 注册执行 1.3 三种注册方法 1.3.1 函数定义和注册分开 1.3.2 定义函数时注册 1.3.3  register_function 函数注册 二、实例 本文主要对 AutoGen Function Call

PHP7扩展开发之函数调用

前言 在这篇文章中我们将演示如何在扩展中调用函数,和调用对象的方法。代码示例如下: <?phpclass demo {public function get_site_name ($prefix) {return $prefix."信海龙的博客\n";}}function get_site_url ($prefix) {return $prefix."www.bo56.com\n";}