efl格式分析

2024-03-08 04:40
文章标签 分析 格式 efl

本文主要是介绍efl格式分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近研究了一下elf文件格式,发现好多资料写的都比较繁琐,可能会严重打击学习者的热情,我把自己研究的结果和大家分享,希望我的描述能够简洁一些。

一、基础知识

       elf是一种文件格式,用于存储Linux程序.它内部都有一些什么信息呢?大概包括编制好的计算机指令,数据,计算机在需要的时候把这个文件读取到内存中,cpu就可以从内存中一条一条的读取指令来执行了。所以说想明白elf格式,我们应该了解一下计算机执行程序需要那些信息。所以这一节,我们补充一些计算机系统的基础知识。

进程和虚拟内存:

        Linux系统给每个进程分配了4GB的空间,其中0xC00000000xFFFFFFFF这个地址段是留给系统使用的,主要用于系统(linux内核)和进程通信和交换数据,  用户可以使用3GB的空间从(0x00000000-0xBFFFFFFF).

其实计算机的内存是没有那么大的,比如我们实际使用的计算机只有2G,以前更小,只有几百M,而且一台计算机上不只运行一个进程,一个占用4G,如果有10个进程,那就得着用40G了,哪有那么打的内存呢?其实这个不要紧,因为操作系统分配给用户的是虚拟内存,程序要可以使用3G的内存。至于操作系统怎样把虚拟内存转化成物理内存,对于开发应用程序的工程师来说,是不需要了解的。我们直接使用虚拟内存就可以了,而不用担心其它进程会侵犯到你的内存空间。

进程的创建和运行进程的创建和运行大致经历了以下步骤:

1.用户请求运行程序时,操作系统会读取存储在磁盘上的可执行文件,在linux系统上这个文件就是我们的elf格式文件,为用户分配4G的虚拟内存空间,

2.根据文件的信息指示,把不同的文件内容放到为你分配的这3G虚拟内存

3.然后根据文件的指示,系统设置设置代码段和数据段寄存器

4.然后根据文件的指示,跳转到用户的代码的入口地址(一般就是我们的main函数)

5.main开始,计算机就一条一条的执行我们给的指令,处理我们的数据了,直到我们程序结束。虽然在这个过程中,系统会多次切换到其他进程,但对用户程序来说没有影响,我们可以认为计算机只为我们服务。

通过以上我们多次看到计算机是根据文件指示这样的语言,所以学习elf首先要理解elf指示了那些信息。

二、可执行的elf文件。

elf文件分三种类型:1、目标文件(通常是.o);2、可执行文件(我们的运行文件)  3、动态库(.so)

我们先讲一下可执行文件。

可执行文件一般分成4个部分,能扩展,我们理解这4部分就够了。

1elf文件头,这个文件是对elf文件整体信息的描述,在32位系统下是56的字节,在64位系统下是64个字节。对于可执行文件来说,文件头包含的一下信息与进程启动相关

         e_entry        程序入口地址 

         e_phoff        segment偏移

         e_phnum     segment数量

2.segment表,这个表是加载指示器,操作系统(确切的说是加载器,有些elf文件,比如操作系统内核,是由其他程序加载的),该表的结构非常重要。

typedef struct
{
Elf64_Word  p_type; /* Segment type */Elf64_Word  p_flags; /* Segment flags segment权限,6表示可读写,5表示可读可执行*/Elf64_Off      p_offset;/* Segment file offset 段在文件中的偏移*/Elf64_Addr   p_vaddr;/* Segment virtual address 虚拟内存地址,这个表示内存中的*/
Elf64_Addr      p_paddr; /* Segment physical address 物理内存地址,对应用程序来说,这个字段无用*/
Elf64_Xword    p_filesz; /* Segment size in file 段在文件中的长度*/
Elf64_Xword     p_memsz;  /* Segment size in memory 在内存中的长度,一般和p_filesz的值一样*/
Elf64_Xwordp_align;/* Segment alignment  段对齐*/
} Elf64_Phdr;

3.elf的主题,对于可执行文件来说,最主要的就是数据段和代码段

4.section表,对可执行文件来说,没有用,在链接的时候用,是对代码段数据段在链接是的一种描述。

整个elf文件的组成可以使用下图来描述 


该图片使用的是LinuxC编程作者宋劲斌的图片

上图programheader table 实际上就是我们说的segmenttable.segments是从运行的角度来描述elf文件,sections是从链接的角度来描述elf文件的。

本节我们只将elf文件的执行,所以我们只讲segment相关的内容。

我们将通过一个例子来讲解系统加载elf的过程(64位平台)

.section .data
.global data_item
data_item:
.long 3,67,28
.section .text
.global _start
_start:
mov $1,%eax
mov $4,%ebx
int $0x80

编译链接后生成hello文件,我们分析hello文件.

执行:readelf-h ../asm/helloreadelf-h是读取elf文件头的命令)

ELFHeader:
Magic                      7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
Class:                     ELF64
Data:                       2's complement, little endian
Version:                  1 (current)
OS/ABI:                  UNIX - System V
ABI Version:          0
Type:                     EXEC(Executable file)
Machine:               Advanced Micro Devices X86-64
Version:                 0x1
Entry point address:                  0x400b0//
程序的入口地址是0x4000b0
Startof program headers:          64 (bytes into file) //segment
表在文件64字节偏移处
Startof section headers:            240 (bytes into file)
Flags:                                        0x0
Size of thisheader:                    64 (bytes)
Size of program headers:          56(bytes)//segment
头项的长度是56字节(32系统是32字节)
Number of program headers:    2
Size of section headers :          64(bytes)
Number of section headers:      6
Section header stringtable index: 3

对于程序的装载,我们关心这三项:

Entrypoint address:                          0x4000b0//程序的入口地址是0x4000b0

Startof program headers:                 64 (bytes into file)//segment表在文件64字节偏移处

Sizeof program headers:                  56 (bytes)//segment头项的长度是56字节(32系统是32字节)

以上内容告诉我们segment表在文件的64字节处,我们看看64字节处有什么内容。

执行readelf-l ../asm/hello 输出segments信息。(readelf-l读取segments)

ProgramHeaders:
Type                     Offset                       VirtAddr                     PhysAddr
FileSiz                  MemSiz                    Flags                        Align
LOAD               0x0000000000000000                       0x0000000000400000              0x0000000000400000
                         0x00000000000000bc                       0x00000000000000bc   RE      200000
LOAD               0x00000000000000bc                       0x00000000006000bc               0x00000000006000bc
                         0x000000000000000c                       0x000000000000000c   RW      200000
Section to Segment mapping:
SegmentSections...
00         .text
01         .data

我们看到程序有两个segment,分别叫做.text.data

       .textOffset0FileSiz0x0,MemSiz0xbc,VirtAddr0x400000,FlagsRE,表示加载起将把elf文件中从0字节开始直到oxbc处的内容加载到虚拟内存中的0x400000处,占用0xbc长度的内存。设置该内存的权限是RE(可读,可执行),这一段的内容正好是elf头,segment stable,和代码段。

        在看看elf headere_entry 的地址 0x4000b0,这个地址正好是代码段的起始地址.dataOffset0FileSiz0xbc,MemSiz0x0c,VirtAddr0x6000bc,FlagsRW,表示加载起将把elf文件中从bc字节开始直到oxbc+ 0xc处的内容加载到虚拟内存中的0x6000bc处,占用0x0c长度的内存。设置该内存的权限是RE(可读,可执行)

为什么数据段的其实地址是0x6000bc,而不是0x6000000呢,这是由Align决定的,Align决定内存和磁盘以1M为单位进行映射,在文件中.data.text处于一个页面中,在映射的时候,直接把整个页面都映射到了0x6000000处,所以把数据段的偏移设置成了0x60000bc,0x6000000x6000bc的内容不使用。

有了以上内容,系统就可以根据elf文件创建进程了。


这篇关于efl格式分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/786035

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

easyui同时验证账户格式和ajax是否存在

accountName: {validator: function (value, param) {if (!/^[a-zA-Z][a-zA-Z0-9_]{3,15}$/i.test(value)) {$.fn.validatebox.defaults.rules.accountName.message = '账户名称不合法(字母开头,允许4-16字节,允许字母数字下划线)';return fal

三相直流无刷电机(BLDC)控制算法实现:BLDC有感启动算法思路分析

一枚从事路径规划算法、运动控制算法、BLDC/FOC电机控制算法、工控、物联网工程师,爱吃土豆。如有需要技术交流或者需要方案帮助、需求:以下为联系方式—V 方案1:通过霍尔传感器IO中断触发换相 1.1 整体执行思路 霍尔传感器U、V、W三相通过IO+EXIT中断的方式进行霍尔传感器数据的读取。将IO口配置为上升沿+下降沿中断触发的方式。当霍尔传感器信号发生发生信号的变化就会触发中断在中断

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除

PostgreSQL核心功能特性与使用领域及场景分析

PostgreSQL有什么优点? 开源和免费 PostgreSQL是一个开源的数据库管理系统,可以免费使用和修改。这降低了企业的成本,并为开发者提供了一个活跃的社区和丰富的资源。 高度兼容 PostgreSQL支持多种操作系统(如Linux、Windows、macOS等)和编程语言(如C、C++、Java、Python、Ruby等),并提供了多种接口(如JDBC、ODBC、ADO.NET等