简单理解COFF文件

2023-10-30 19:20
文章标签 简单 理解 coff

本文主要是介绍简单理解COFF文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

COFF文件

COFF文件是我在初学对象模型的时候看底层代码用的,是通过obj文件转换的,也就是一种目标文件
官方描述:
COFF(Common Object File Format)是一种常见的目标文件格式,用于存储可重定位目标文件、静态库文件和可执行文件。COFF最初由UNIX System Laboratories(USL)定义,现在被广泛地使用在各种操作系统上,包括Windows、Linux和BSD等。
COFF格式的目标文件由多个段(Section)组成,每个段包含一定范围的数据,例如代码、数据和符号表等。每个段都有一个段头(Section Header),它包含有关该段的信息,例如名称、大小、地址、属性等。段头表(Section Header Table)记录了所有段头的信息。
COFF格式的可执行文件由多个段、符号表和重定位表等组成。符号表用于记录程序中的符号信息,例如函数名和变量名,重定位表则用于在程序加载时对代码中的符号和地址进行重定位。可执行文件还包含程序入口点和其他可执行代码相关的元数据。
COFF是一种通用格式,它被多种编译器、链接器和调试器所支持。具体而言,COFF格式在Windows和MS-DOS上得到广泛应用,在Unix/Linux上也有被广泛使用。

尝试阅读COFF

为了看懂C++底层是如何运行的,就必须要让自己学会看一些正常人不喜欢的看的文件,比如说COFF文件
先来一串代码

#include <iostream>class A
{
public:A(){std::cout << "构造函数" << std::endl;}A(int a){std::cout << a << std::endl;}
public:int a;
};class B
{
public:B():tempa(1), tempb(2) {}
public:A tempb;A tempa;A tempc;
};int main()
{B b;return 0;
}

先来分析以下这个代码,就是一个比较简单的初始化列表的代码,代码的执行应该是:

  1. 执行tempb的有参构造函数
  2. 执行tempa的有参构造函数
  3. 执行tempc的无参构造函数
    先在来看一下COFF文件
SECTION HEADER #E
.text$mn name0 physical address0 virtual address66 size of raw data8C66 file pointer to raw data (00008C66 to 00008CCB)8CCC file pointer to relocation table0 file pointer to line numbers6 number of relocations0 number of line numbers
60501020 flagsCodeCOMDAT; sym= "public: __thiscall B::B(void)" (??0B@@QAE@XZ)16 byte alignExecute ReadRAW DATA #E00000000: 55 8B EC 81 EC CC 00 00 00 53 56 57 51 8D BD 34  U.ì.ìì...SVWQ.?400000010: FF FF FF B9 33 00 00 00 B8 CC CC CC CC F3 AB 59  ???13...?ììììó?Y00000020: 89 4D F8 B9 00 00 00 00 E8 00 00 00 00 6A 02 8B  .M?1....è....j..00000030: 4D F8 E8 00 00 00 00 6A 01 8B 4D F8 83 C1 04 E8  M?è....j..M?.á.è00000040: 00 00 00 00 8B 4D F8 83 C1 08 E8 00 00 00 00 8B  .....M?.á.è.....00000050: 45 F8 5F 5E 5B 81 C4 CC 00 00 00 3B EC E8 00 00  E?_^[.?ì...;ìè..00000060: 00 00 8B E5 5D C3                                ...?]?RELOCATIONS #ESymbol    SymbolOffset    Type              Applied To         Index     Name--------  ----------------  -----------------  --------  ------00000024  DIR32                      00000000        35  __0BB07FEC_初始化列表@cpp00000029  REL32                      00000000        DA  @__CheckForDebuggerJustMyCode@400000033  REL32                      00000000        CF  ??0A@@QAE@H@Z (public: __thiscall A::A(int))00000040  REL32                      00000000        CF  ??0A@@QAE@H@Z (public: __thiscall A::A(int))0000004B  REL32                      00000000        CE  ??0A@@QAE@XZ (public: __thiscall A::A(void))0000005E  REL32                      00000000        DD  __RTC_CheckEsp

在这里插入图片描述
图片跟上面帖的代码是一样的,这里只取了一部分,因为我也看不懂,只是做一个记录。

2518行 SECTION HEADER

是指可执行文件中的一个头部部分,其描述了程序段的一些信息,例如代码段的起始物理和虚拟地址(偏移),以及每个程序段的大小等等。
#E
在可执行文件和目标文件中,每个节/段通常都有一个称为节/段头(section header)或段头(segment header)的数据结构,它包含有关该节/段的信息,例如大小,位置和访问权限。这个节头的标识符通常由一个字母或数字来标识。在这里,#E 中的 E 是这个段头标识符的一部分,表示这个段是代表可执行代码的代码段(Code)。节头标识符是使用一定的规则来定义的,可以在文档中找到具体的说明。

2530行 COMDAT

是指一种在C++中进行优化的方法,它可以在编译时去重复代码块。在这里的COMDAT表明了编译器可以将B类的构造函数的代码进行去重复。
对于COMDAT中的符号,编译器在处理不同的模块(.obj文件或库)时,通常会为处于相同COMDAT组的相同符号创建一个单一的副本。这种机制可以有效减小可执行文件和动态链接库的大小。这里的“去重”意思是指编译器将 B 类的构造函数的代码从其他处引用的代码独立出来,只在需要调用构造函数的地方生成一遍该代码。这样可以减少可执行文件中的冗余代码,减小程序体积,并加快程序的启动和运行速度。

2531行 16 byte align

指示了这个程序段的起始位置需要按照16字节的对齐方式进行排列。

2532行 Execute Read

表明了这个程序段被加载到内存中后,可以被执行,也可以被读取。

2534行 RAW DATA

是指在可执行文件中以原始二进制形式存储的程序代码,这里的每一条机器码表示CPU指令。

2543行 RELOCATIONS

是指可执行文件中的一个信息表,其中包含了需要在程序运行时进行重新定位的数据和代码的位置。在这里,出现了6个RELOCATIONS,指示了6个位置需要进行重新定位操作。其中每个RELOCATION包含了:
a. 在程序中的偏移量(Offset)
b. 重新定位类型(Type)
c. 需要进行重定位的程序数据/指令(Applied To)
d. 符号表(Symbol Table)中的某个符号(Symbol Name)对应的索引(Symbol Index)

可以看到根据它的执行顺序先执行了A的有参构造,在执行了A的有参构造,在执行了A的无参构造,跟我们的设想是一样的

2552 __RTC_CheckEsp

这个符号,它可能是与Microsoft Visual C++ 一起使用的运行时检查器的一部分,这个检查器用于抓住C++编程错误,例如数组越界

目前笔者的能力只能到这里!

这篇关于简单理解COFF文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/310057

相关文章

C++初始化数组的几种常见方法(简单易懂)

《C++初始化数组的几种常见方法(简单易懂)》本文介绍了C++中数组的初始化方法,包括一维数组和二维数组的初始化,以及用new动态初始化数组,在C++11及以上版本中,还提供了使用std::array... 目录1、初始化一维数组1.1、使用列表初始化(推荐方式)1.2、初始化部分列表1.3、使用std::

redis群集简单部署过程

《redis群集简单部署过程》文章介绍了Redis,一个高性能的键值存储系统,其支持多种数据结构和命令,它还讨论了Redis的服务器端架构、数据存储和获取、协议和命令、高可用性方案、缓存机制以及监控和... 目录Redis介绍1. 基本概念2. 服务器端3. 存储和获取数据4. 协议和命令5. 高可用性6.

JAVA调用Deepseek的api完成基本对话简单代码示例

《JAVA调用Deepseek的api完成基本对话简单代码示例》:本文主要介绍JAVA调用Deepseek的api完成基本对话的相关资料,文中详细讲解了如何获取DeepSeekAPI密钥、添加H... 获取API密钥首先,从DeepSeek平台获取API密钥,用于身份验证。添加HTTP客户端依赖使用Jav

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

深入理解C语言的void*

《深入理解C语言的void*》本文主要介绍了C语言的void*,包括它的任意性、编译器对void*的类型检查以及需要显式类型转换的规则,具有一定的参考价值,感兴趣的可以了解一下... 目录一、void* 的类型任意性二、编译器对 void* 的类型检查三、需要显式类型转换占用的字节四、总结一、void* 的

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

使用IntelliJ IDEA创建简单的Java Web项目完整步骤

《使用IntelliJIDEA创建简单的JavaWeb项目完整步骤》:本文主要介绍如何使用IntelliJIDEA创建一个简单的JavaWeb项目,实现登录、注册和查看用户列表功能,使用Se... 目录前置准备项目功能实现步骤1. 创建项目2. 配置 Tomcat3. 项目文件结构4. 创建数据库和表5.

使用PyQt5编写一个简单的取色器

《使用PyQt5编写一个简单的取色器》:本文主要介绍PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16进制颜色编码,一款跟随鼠标刷新图像的RGB和16... 目录取色器1取色器2PyQt5搭建的一个取色器,一共写了两款应用,一款使用快捷键捕获鼠标附近图像的RGB和16