进程和ELF文件

2024-03-16 09:36
文章标签 进程 elf

本文主要是介绍进程和ELF文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

程序的二进制格式:

关联知识:GCC编译原理与使用-CSDN博客

linux二进制程序的严格格式:ELF(Executeable and Linkable format)

一 预处理,编译,汇编得到的.o文件,就是ELF的第一种类型:可重定位文件

  • ELF文件头:用于描述整个文件,这个文件格式在内核中又定义,分别是struct elf32_hdr 和 struct elf64_hdr。
  • .text:放编译好的二进制可执行代码
  • .data:已经初始化好的全局变量
  • .rodata:只读数据,例如字符串常量、const 的变量
  • .bss:未初始化全局变量,运行时会置 0
  • .symtab:符号表,记录的则是函数和变量
  • .strtab:字符串表、字符串常量和变量名

什么是可重定位

编译好的代码和变量,将来加载到内存里面的时候,都是要加载到一定位置的,所以.o文件里面调用的函数的代码位置等是不确定的,但是必须可重新定位,有的 section,例如.rel.text, .rel.data 就与重定位有关。在rel.text中标注不包含在当前".o"文件中函数,表明需要重定位

二 静态链接可以将相关的函数调用合并起来,形成二进制文件叫可执行文件,是ELF的第二种格式

ar cr libstaticprocess.a process.o #将process.o静态连接成 libstaticprocess.a静态链接库
gcc -o staticcreateprocess createprocess.o -L. -lstaticprocess 
# -L 表示在当前目录下找.a 文件,-lstaticprocess 会自动补全文件名,比如加前缀 lib,后缀.a,变成 libstaticprocess.a,找到这个.a 文件后,
#将里面的 process.o 取出来,和 createprocess.o 做一个链接,形成二进制执行文件 staticcreateprocess。

这个格式和.o 文件大致相似,还是分成一个个的 section,并且被节头表描述。只不过这些 section 是多个.o 文件合并过的。但是这个时候,这个文件已经是马上就可以加载到内存里面执行的文件了,因而这些 section 被分成了需要加载到内存里面的代码段、数据段和不需要加载到内存里面的部分,将小的 section 合成了大的段 segment,并且在最前面加一个段头表(Segment Header Table)。在代码里面的定义为 struct elf32_phdr 和 struct elf64_phdr,这里面除了有对于段的描述之外,最重要的是 p_vaddr,这个是这个段加载到内存的虚拟地址。

静态链接库一旦链接进去,代码和变量的 section 都合并了,因而程序运行的时候,就不依赖于这个库是否存在。但是这样有一个缺点,就是相同的代码段,如果被多个程序使用的话,在内存里面就有多份,而且一旦静态链接库更新了,如果二进制执行文件不重新编译,也不随着更新。

所以出现了动态链接库:不仅仅是一组对象文件的简单归档,而是多个对象文件的重新组合,可被多个程序共享。

当一个动态链接库被链接到一个程序文件中的时候,最后的程序文件并不包括动态链接库中的代码,而仅仅包括对动态链接库的引用,并且不保存动态链接库的全路径,仅仅保存动态链接库的名称。

gcc -shard -fPIC -o libdynamicprocess.so process.o #-fPIC选项用于生成位置独立代码 -shared 用于生成动态链接库文件 gcc -o dynamiccreateprocess createprocess.o -L. -ldynamicproccess #找到动态链接库文件和createprocess.o一起生成可执行文件

当运行某个程序的时候,首先寻找动态链接库,然后加载它。默认情况下,系统在 /lib 和 /usr/lib 文件夹下寻找动态链接库。如果找不到就会报错,我们可以设定 LD_LIBRARY_PATH 环境变量,程序运行时会在此环境变量指定的文件夹下寻找动态链接库。

三 动态链接库,就是 ELF 的第三种类型,共享对象文件(Shared Object)。

基于动态链接库创建出来的二进制文件格式还是ELF,但是稍有不同:

  • 多了一个.interp的Segment,里面是ld-linux.so,这就是动态链接器,运行时的链接动作都是它做的
  • 多了两个section,一个是.plt,过程链接表(Procedure Linkage Table,PLT),一个是got.plt,全局偏移量表(Global Offset Table,GOT)

过程:

  • GOT 一开始就会创建一项 GOT[y],但是没有真正的地址,回调 PLT
  • PLT 这个时候会转而调用 PLT[0],也即第一项,PLT[0]转而调用 GOT[2],这里面是 ld-linux.so 的入口函数,这个函数会找到加载到内存中的 libdynamicprocess.so 里面的 create_process 函数的地址,然后把这个地址放在 GOT[y]里面。
  • 在二进制程序里面,不直接调用 create_process 函数,而是调用 PLT[x]里面的代理代码
  • 代理代码调用 GOT 表中对应项 GOT[y],调用的就是加载到内存中的 libdynamicprocess.so 里面的 create_process 函数了。

运行程序为进程

如果将ELF文件加载到内存里面

  • 加载二进制文件的方法
struct linux_binfmt {struct list_head lh;struct module *module;int (*load_binary)(struct linux_binprm *);int (*load_shlib)(struct file *);int (*core_dump)(struct coredump_params *cprm);unsigned long min_coredump;     /* minimal dump size */
} __randomize_layout;//加载ELF文件格式的二进制文件的的实现
static struct linux_binfmt elf_format = {.module         = THIS_MODULE,.load_binary    = load_elf_binary,.load_shlib     = load_elf_library,.core_dump      = elf_core_dump,.min_coredump   = ELF_EXEC_PAGESIZE,
};

加载内核镜像的时候也是使用的load_elf_binary

系统初始化(关联知识:待发布)

调用路径为:do_execve->do_execveat_common->exec_binprm->search_binary_handler->load_elf_binary

do_execve是被exec这个系统调用调用的

exec 是一组函数:

  • 包含 p 的函数(execvp, execlp)会在 PATH 路径下面寻找程序;
  • 不包含 p 的函数需要输入程序的全路径;
  • 包含 v 的函数(execv, execvp, execve)以数组的形式接收参数;
  • 包含 l 的函数(execl, execlp, execle)以列表的形式接收参数;
  • 包含 e 的函数(execve, execle)以数组的形式接收环境变量

进程树:

ps -ef 展示的进程,带中括号的都是内核态的进程,祖先都是2号进程,不带中括号的都是用户态的进程,祖先是1号进程

总结:

首先通过图右边的文件编译过程,生成 so 文件和可执行文件,放在硬盘上。下图左边的用户态的进程 A 执行 fork,创建进程 B,在进程 B 的处理逻辑中,执行 exec 系列系统调用。这个系统调用会通过 load_elf_binary 方法,将刚才生成的可执行文件,加载到进程 B 的内存中执行

工具

  • readelf 工具用于分析 ELF 的信息
  • objdump 工具用来显示二进制文件的信息
  • hexdump 工具用来查看文件的十六进制编码
  • nm 工具用来显示关于指定文件中符号的信息

这篇关于进程和ELF文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/815063

相关文章

Android进程保活全攻略(中)

在上一篇博客Android进程保活全攻略(上)中介绍了进程保活的背景和一些方法的思路和实现方式,本篇博客我将承接上篇博客,继续进行介绍。 9) 1像素悬浮层 **思路:**1像素悬浮层是传说的QQ黑科技,监控手机锁屏解锁事件,在屏幕锁屏时启动1个像素的 Activity,在用户解锁时将 Activity 销毁掉。注意该 Activity 需设计成用户无感知。通过该方案,可以使进程的优先级在屏幕

Android进程保活全攻略(上)

对于每个公司的APP来说,当然都希望自己APP的进程尽量的不被杀死,于是乎,就有了一些列进程保活的方法出现,网上也有很多关于这类的文章,但网上很多资料往往只告诉了思路,并未将实现代码展示,本次我的博客将分为上下两篇,阐述关于进程保活的所有方法,以及实现的方式,若有错漏之处,大家可以在博客进行留言。 ** 1.进程保活-背景知识 ** (1)什么时候系统会去杀死进程? Android系统会

Android Framework学习(三)之SyetemServer进程启动解析

从上篇博客中,我们知道了Zygote进程启动了SyetemServer进程,本篇博客我们就一起来学习SyetemServer进程。 SystemServer的作用 整个系统的android framework进程启动流程如下: init进程 –> Zygote进程 –> SystemServer进程 –>各种应用进程 SystemServer进程主要的作用是启动各种系统服务,比如Activ

Android Framework学习(二)之Zygote进程启动解析

上篇博客,我们学习了init进程的相关知识,本篇博客我们一次来学习zygote进程的相关知识。 Zygote简介 在Android系统中,JavaVM(Java虚拟机)、应用程序进程以及运行系统的关键服务的SystemServer进程都是由Zygote进程来创建的,我们也将它称为孵化器。它通过fock(复制进程)的形式来创建应用程序进程和SystemServer进程,由于Zygote进程在启动

Python17 多进程multiprocessing

1.多进程与多线程的区别 在Python中,多线程(multithreading)和多进程(multiprocessing)是两种并行执行任务的方式,它们有一些关键的区别: 进程和线程的基本区别: 进程:进程是操作系统分配资源和调度的基本单位,每个进程都有自己独立的内存空间和资源。多进程环境下,同一个程序可以运行在不同的内存地址空间中,进程之间不会相互干扰。 线程:线程是进程的一

Linux 7种 进程间通信方式

传统进程间通信         通过文件实现进程间通信 必须人为保证先后顺序        A--->硬盘---> B(B不知道A什么时候把内容传到硬盘中) 1.无名管道 2.有名管道 3.信号 IPC进程间通信 4.消息队列 5.共享内存 6.信号灯集 7.socket通信 一、无名管道(亲缘关系的进程   64K) 原理:         如果A和B进程想要通过无名管道

【Linux】进程间通信_1

文章目录 七、进程间通信1. 进程间通信分类管道 未完待续 七、进程间通信 进程间由于 进程具有独立性 ,所以不可以直接进行数据传递。但是我们通常需要多个进程协同,共同完成一件事,所以我们需要进程间通信的手段。进程间通信的本质就是先让不同的进程看到同一份资源,这个资源一般都是由操作系统提供。 1. 进程间通信分类 管道 父进程和子进程分别使用 r 和 w 方式打开同

linux下I/O模型并发的epoll多进程池协程实现

方法1 主要思路: 定义了一个EventData结构体,用于存储事件相关的数据,如文件描述符、epoll 文件描述符、协程 ID 等。EchoDeal函数用于处理请求消息,并生成响应消息。handlerClient函数是协程的执行函数,用于处理客户端连接。它通过循环读取数据、解析请求、执行业务处理、发送响应等步骤,实现了对客户端请求的处理。handler函数是主函数,用于创建监听套接字、初始化

Linux进程学习笔记

svchost.exe:svchost.exe是一个属于微软Windows操作系统的系统程序,微软官方对它的解释是:Svchost.exe 是从动态链接库 (DLL) 中运行的服务的通用主机进程名称。这个程序对系统的正常运行,是非常重要,而且是不能被结束的。位置:C:\Windows\System32 进程:正在执行的程序 ,进程有独立的地址空间,只能在内存分配的地址空间内活动 有

操作系统真象还原:用户进程

第11章-用户进程 这是一个网站有所有小节的代码实现,同时也包含了Bochs等文件 11.1 为什么要有任务状态TSS Linux 任务切换未采用 Intel 的做法,而是用了一套自己的方法,只是用了 TSS 的一小部分功能。 操作系统最直接控制的就是 CPU,要想让 CPU 这颗奔腾的心永远地跳下去,首先必须把内存分成段,把内存按“内存块”访问,其次必须让代码段寄存器 cs 和指令寄存器