本文主要是介绍CSAPP《深入理解计算机系统》深读笔记4——第三章-程序的机器级表示(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
CSAPP《深入理解计算机系统》深读笔记4——第三章-程序的机器级表示(一)
你好我是拉依达,这是我秋招结束后更新的第一个系列。我将争取完成“ 年轻人,你渴望力量吗?”的全套深度笔记。
今天开始进行第一本CSAPP:深入理解计算机系统。
程序的机器级表示
编译器基于编程语言的规则、目标机器的指令集和操作系统遵循的惯例,经过一系列的阶段生成机器代码。
GCC C语言编译器以汇编代码的形式产生输出(汇编代码是机器代码的文本表示,给出程序中的每一条指令)。然后 GCC调用汇编器和链接器,根据汇编代码生成可执行的机器代码。
那么为什么我们还要花时间学习机器代码呢?
通过阅读这些汇编代码,我们能够理解编译器的优化能力,并分析代码中隐含的低效率。试图最大化一段关键代码性能的程序员,通常会尝试源代码的各种形式,每次编译并检查产生的汇编代码,从而了解程序将要运行的效率如何。
程序编码
假设一个C程序,有两个文件p1.c
和 p2.c
。我们用Unix命令行编译这些代码:
linux> gcc -Og -o p p1.c p2.c
命令gcc
指的就是GCC C编译器。因为这是Linux上默认的编译器,我们也可以简单地用cc
来启动它。
编译选项-Og
告诉编译器使用会生成符合原始C代码整体结构的机器代码的优化等级。
使用较高级别优化产生的代码会严重变形,以至于产生的机器代码和初始源代码之间的关系非常难以理解。
因此我们会使用
-Og
优化作为学习工具,然后当我们增加优化级别时,再看会发生什么。实际中,从得到的程序的性能考虑,较高级别的优化(例如,以选项-O1
或-O2
指定)被认为是较好的选择。
实际上gcc
命令调用了一整套的程序,将源代码转化成可执行代码。
- 首先,C预处理器扩展源代码,插人所有用
#include
命令指定的文件,并扩展所有用#define
声明指定的宏。 - 其次,编译器产生两个源文件的汇编代码,名字分别为
p1.s
和p2.s
。 - 接下来,汇编器会将汇编代码转化成二进制目标代码文件
p1.o
和p2.o
。目标代码是机器代码的一种形式,它包含所有指令的二进制表示,但是还没有填入全局值的地址。 - 最后,链接器将两个目标代码文件与实现库函数(例如
printf
)的代码合并,并产生最终的可执行代码文件P
。
机器级代码
对于机器级编程来说,其中两种抽象无为重要
- 指令集体系结构或指令集架构(InstructionSetArchitecture,ISA)来定义机器级程序的格式和行为,它定义了处理器状态、指令的格式,以及每条指令对状态的影响。大多数 ISA,包括x86-64,将程序的行为描述成好像每条指令都是按顺序执行的,一条指令结束后,下一条再开始。处理器的硬件远比描述的精细复杂,它们并发地执行许多指令,但是可以采取措施保证整体行为与ISA指定的顺序执行的行为完全一致。
- 机器级程序使用的内存地址是虚拟地址,提供的内存模型看上去是一个非常大的字节数组。存储器系统的实际实现是将多个硬件存储器和操作系统软件组合起来
x86-64的机器代码和原始的C代码差别非常大。一些通常对C语言程序员隐藏的处理器状态都是可见的:
-
程序计数器(通常称为“PC”,在x86-64中用
%rip
表示)给出将要执行的下一条指令在内存中的地址。 -
整数寄存器文件包含16个命名的位置,分别存储64位的值。这些寄存器可以存储地址(对应于C语言的指针)或整数数据。有的寄存器被用来记录某些重要的程序状态,而其他的寄存器用来保存临时数据,例如过程的参数和局部变量,以及函数的返回值。
-
条件码寄存器保存着最近执行的算术或逻辑指令的状态信息。它们用来实现控制或数据流中的条件变化,比如说用来实现i王和while语句。
-
一组向量寄存器可以存放一个或多个整数或浮点数值。
在C程序中插入汇编代码有两种方法:
- 第一种是,我们可以编写完整的函数,放进一个独立的汇编代码文件中,让汇编器和链接器把它和用C语言书写的代码合并起来。
- 第二种方法是,我们可以使用GCC的内联汇编(inlineassembly)特性,用asm伪指令可以在C程序中包含简短的汇编代码。这种方法的好处是减少了与机器相关的代码量。
数据格式
Intel用术语字(word)”表示16位数据类型。因此,称32位数为“双字(doublewords)”,称64位数为“四字(quadwords)”。
C语言基本数据类型对应的x86-64表示。标准int
值存储为双字(32位)。 指针(在此用char*
表示)存储为8字节的四字,数据类型long
实现为64位,充许表示的值范围较大。
浮点数主要有两种形式:单精度(4字节)值,对应于C语言数据类型float
,双精度(8字节)值,对应于C语言数据类型double
。
x86家族的微处理器历史上实现过对种特殊的80位(10字节)浮点格式进行全套的浮点运算,可以在C程序中用声明
long double
来指定这种格式。不过我们不建议使用这种格式。它不能移植到其他类型的机器上,而且实现的硬件也不如单精度和双精度算术运算的高效。
大多数GCC生成的汇编代码指令都有一个字符的后缀,表明操作数的大小。
例如,数据传送指令有四个变种:movb(传送字节)、movw(传送字)、movl(传送双字)和movq(传送四字)。
后缀‘l’用来表示双字,因为32位数被看成是“长字(long word)”。
注意,汇编代码也使用后缀l来表示4字节双字整数和8字节双精度浮点数。这不会产生歧义,因为浮点数使用的是一组完全不同的指令和寄存器。
访问信息
一个x86-64的中央处理单元(CPU)包含一组16个存储64位值的通用目的寄存器。 这些寄存器用来存储整数数据和指针。
图显示了这16个寄存器。它们的名字都以%工开头,不过后面还跟着一些不同的命名规则的名字,这是由于指令集历史演化造成的。
最初的8086中有8个16位的寄存器,即图中的%ax
到%bp
。每个寄存器都有特殊的用途,它们的名字就反映了这些不同的用途。扩展到IA32架构时,这些寄存器也扩展成32 位寄存器,标号从%eax到%ebp
。扩展到x86-64后,原来的8个寄存器扩展成64位,标号从%rax
到%rbp
。除此之外,还增加了8个新的寄存器,它们的标号是按照新的命名规则制定的:从%r8
到%r15
。
在常见的程序里不同的寄存器扮演不同的角色。 其中最特别的是栈指针%rsp
,用来指明运行时栈的结束位置。有些程序会明确地读写这个寄存器。另外15个寄存器的用法更灵活。少量指令会使用某些特定的寄存器。
这篇关于CSAPP《深入理解计算机系统》深读笔记4——第三章-程序的机器级表示(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!