深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游

2023-12-16 12:52

本文主要是介绍深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游

请添加图片描述
你好我是拉依达,这是我秋招结束后更新的第一个系列。我将争取完成“ 年轻人,你渴望力量吗?”的全套深度笔记。

今天开始进行第一本CSAPP:深入理解计算机系统。

最基本的C程序—hello程序

一段最基本的hello.c源程序
//hello.c
#include <stdio.h>
int main()
{printf("hello, world\n");return
}

源程序的本质是0 1组成的位序列,8个位为一个字节。计算机中使用ASCII码表示文字字符,一个单字节表示一个字符

hello.c 源文件的ASCII码

在这里插入图片描述

hello.c 的源程序就是已字节序列的方式存储在文件中,每个字符对应一个字节(如上图),这种只由ASCII码组成的文件称为

hello程序的生命周期从C程序开始,转化到机器语言指令,最后打包成目标程序(可执行文件)

编译系统的四个阶段

在这里插入图片描述

  1. 预处理阶段: 预处理器(cpp)根据字符#开头的命令处理源程序生成.i文件
  2. 编译阶段: 编译器(ccl)将文本文件翻译成汇编程序的.s文本文件
汇编程序文本

在这里插入图片描述

  1. 汇编阶段: 汇编器(as)将汇编程序翻译成机器语言指令,打包成一种可重定位目标程序 的.o文件。是二进制文件
  2. 链接阶段: 链接器(ld)负责将多个.o的目标文件合并,生成一个可执行的目标程序,如hello,可以被加载到内存中系统执行

了解编译系统的好处

  1. 优化程序性能
  2. 理解链接时出现的错误
  3. 避免安全漏洞

系统的硬件组成

系统硬件组成

请添加图片描述

  1. 总线: 携带信息字节在各个部件间传递,传递定长的字节块,也就是字(word)。总线通常是4个字长(32位)或者8个字长(64位)

  2. I/O设备: 是系统与外界联系的通道。 每个IO设备都通过一个控制器或者适配器与IO总线相连。控制器是IO设备本身或者主板上的芯片,适配器插在主板上卡,功能都是在IO设备和IO总线之间传递信息

  3. 内存(内存): 临时存储设备,存放程序和数据。硬件由DRAM芯片组成,逻辑上是一个线性的字节数组,每个字节由唯一的地址

  4. 处理器: 中央处理单元(cpu),执行在内存中指令的引擎。
    处理器的核心是一个大小为一个字的寄存器,称为程序计数器(PC)。

    处理器从PC指向的内存处读取指令,解释指令中的位,执行该指令指示的简单操作,然后更新PC。

    CPU在指令的要求下可能会执行这些操作

    • 加载:从内存复制一个字节或者一个字到寄存器,以覆盖寄存器原来的内容。
    • 存储:从寄存器复制一个字节或者一个字到内存的某个位置,以覆盖这个位置上原来的内容。
    • 操作:把两个寄存器的内容复制到算术/逻辑单元(ALU),ALU对这两个字做算术运算,并将结果存放到一个寄存器中,以覆盖该寄存器中原来的内容。
    • 跳转:从指令本身中抽取一个字,并将这个字复制到程序计数器(PC)中,以覆盖PC中原来的值。

处理器的指令集架构和微体系结构

  • 指令集架构描述的是每条机器代码指令的效果
  • 微体系结构描述的是处理器实际上是如何实现的

高速缓存 cache

系统设计者采用了更小更快的存储设备,称为高速缓存存储器( cache memory,简称为 cache或高速缓存),作为暂时的集结区域,存放处理器近期可能会需要的信息。

比较新的、处理能力更强大的系统甚至有三级高速缓存: L1、L2和L3。

系统利用了高速缓存的局部性原理,即程序具有访问局部区域里的数据和代码的趋势。通过让高速缓存里存放可能经常访问的数据,大部分的内存操作都能在快速的高速缓存中完成。

高速缓存存储器

请添加图片描述

存储设备的结构层次

存储器层次结构的主要思想是上一层的存储器作为低一层存储器的高速缓存

因此,寄存器文件就是L1的高速缓存,L1是L2的高速缓存,L2是L3的高速缓存,L3是内存的高速缓存,而内存又是磁盘的高速缓存。在某些具有分布式文件系统的网络系统中,本地磁盘就是存储在其他系统中磁盘上的数据的高速缓存。

存储结构层次

请添加图片描述

操作系统管理硬件

操作系统是应用程序和硬件之间的一层软件。所有应用程序对硬件的操作都必须经过操作系统。

计算机分层

请添加图片描述

操作系统有两个基本功能:

  1. 防止硬件被失控的应用程序滥用;
  2. 向应用程序提供简单一致的机制来控制复杂而又通常大不相同的低级硬件设备。
    操作系统通过几个基本的抽象概念(进程、虚拟内存和文件)来实现这两个功能。

文件是对I/O设备的抽象表示,虚拟内存是对内存和磁盘I/O设备的抽象表示,进程则是对处理器、内存和I/O设备的抽象表示。

os提供的抽象表示

请添加图片描述

进程

进程: 是操作系统对一个正在运行的程序的一种抽象。在一个系统上可以同时运行多个进程,而每个进程都 好像在 独占地使用硬件(并不是真实的独立使用)。

并发运行,则是说一个进程的指令和另个进程的指令是交错执行的。运行的进程数是多于可以运行它们的CPU个数的。CPU看上去都像是在并发地执行多个进程,这是通过处理器在进程间切换来实现的。操作系统实现这种交错执行的机制称为上下文切换

操作系统保持跟踪进程运行所需的所有状态信息。这种状态,也就是上下文,包括许多信息,比如PC和寄存器文件的当前值,以及内存的内容。

当操作系统决定要把控制权从当前进程转移到某个新进程时,就会进行上下文切换,即保存当前进程的上下文、恢复新进程的上下文,然后将控制权传递到新进程。新进程就会从它上次停止的地方开始。

进程上下文切换示意

请添加图片描述

线程

进程实际上可以由多个称为线程的执行单元组成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。

虚拟内存

虚拟内存是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用内存。每个进程看到的内存都是一致的,称为虚拟地址空间

虚拟地址空间分部

请添加图片描述

  • 程序代码和数据: 对所有的进程来说,代码是从同一固定地址开始,紧接着的是和 C全局变量 相对应的数据位置。代码和数据区是直接按照可执行目标文件的内容初始化的
  • 堆: 代码和数据区在进程一开始运行时就被指定了大小,与此不同,当调用像malloc和free这样的C标准库函数时, 堆可以在运行时动态地扩展和收缩
  • 共享库: 大约在地址空间的中间部分是一块用来存放像 C标准库和数学库 这样的共享库的代码和数据的区域。
  • 栈: 位于用户虚拟地址空间顶部的是用户栈,编译器用它来实现函数调用。和堆样,用户栈在程序执行期间可以动态地扩展和收缩。特别地,每次我们调用一个函数时,栈就会增长;从一个函数返回时,栈就会收缩。
  • 内核虛拟内存: 地址空间顶部的区域是为内核保留的。不允许应用程序读写这个区域的内容或者直接调用内核代码定义的函数。相反,它们必须调用内核来执行这些操作。

文件

文件就是字节序列 。每个IO设备,包括磁盘、键盘、显示器,甚至网络,都可以看成是文件。

文件这个简单而精致的概念是非常强大的,因为它向应用程序提供了一个统一的视图,来看待系统中可能含有的所有各式各样的I/O设备。

系统之间利用网络通信

从单独一个系统看, 网络可视为一个I/O设备 。当系统从内存复制一串字节到网络适配器,数据经过网络到达另一台机器。

网络设备作为IO

请添加图片描述

并发和并行

数字计算机的整个历史中,有两个需求是驱动进步的持续动力:

  • 一个是我们想要计算机做得更多;
  • 另一个是我们想要计算机运行得更快。

当处理器能够同时做更多的事情时,这两个因素都会改进。我们用的

  • 术语并发( concurrency)是一个通用的概念,指一个同时具有多个活动的系统;

请添加图片描述

  • 术语并行( parallelism)指的是用并发来使一个系统运行得更快。并行可以在计算机系统的多个抽象层次上运用。
    请添加图片描述

(并行是物理上同时执行,并发是逻辑上等效同时执行)

线程级并发

使用线程,我们甚至能够在一个进程中执行多个控制流。这种并发执行只是 模拟 出来的,是通过使一台计算机在它正在执行的进程间快速切换来实现的。

由单操作系统内核控制的多处理器组成的系统时,我们就得到了一个多处理器系统。

典型多核处理器的组织结构,其中微处理器芯片有4个CPU核,每个核都有自己的L1和L2高速缓存,其中的L1高速缓存分为两个部分个保存最近取到的指令(icache),另一个存放数据(dcache)。这些核共享更高层次的高速缓存,以及到主存的接口。

多核处理器架构

请添加图片描述

超线程,是一项允许一个CPU执行多个控制流的技术。它涉及CPU某些硬件有多个备份,比如程序计数器和寄存器文件,而其他的硬件部分只有一份,比如执行浮点算术运算的单元。

常规的处理器需要大约20000个时钟周期做不同线程间的转换,而超线程的处理器可以在单个周期的基础上决定要执行哪一个线程。这使得CPU能够更好地利用它的处理资源。
比如,假设一个线程必须等到某些数据被装载到高速缓存中,那CPU就可以继续去执行另一个线程。

(举例来说,Intel Core i7处理器可以让每个核执行两个线程,所以一个4核的系统实际上可以并行地执行8个线程)

指令级并行

同时执行多条指令 的属性称为指令级并行。

其实每条指令从开始到结束需要长得多的时间,大约20个或者更多周期,但是处理器使用了非常多的聪明技巧来同时处理多达100条指令。

在流水线中,将执行一条指令所需要的活动划分成不同的步骤,将处理器的硬件组织成一系列的阶段,每个阶段执行一个步骤。这些阶段可以并行地操作,用来处理不同指令的不同部分。

如果处理器可以达到比一个周期一条指令更快的执行速率,就称之为超标量( superscalar)处理器。大多数现代处理器都支持超标量操作。

单指令、多数据并行

许多现代处理器拥有特殊的硬件,允许一条指令产生多个可以并行执行的操作,这种方式称为单指令、多数据,即SIMD并行。

这篇关于深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/500550

相关文章

Java并发编程必备之Synchronized关键字深入解析

《Java并发编程必备之Synchronized关键字深入解析》本文我们深入探索了Java中的Synchronized关键字,包括其互斥性和可重入性的特性,文章详细介绍了Synchronized的三种... 目录一、前言二、Synchronized关键字2.1 Synchronized的特性1. 互斥2.

一文带你深入了解Python中的GeneratorExit异常处理

《一文带你深入了解Python中的GeneratorExit异常处理》GeneratorExit是Python内置的异常,当生成器或协程被强制关闭时,Python解释器会向其发送这个异常,下面我们来看... 目录GeneratorExit:协程世界的死亡通知书什么是GeneratorExit实际中的问题案例

深入解析Spring TransactionTemplate 高级用法(示例代码)

《深入解析SpringTransactionTemplate高级用法(示例代码)》TransactionTemplate是Spring框架中一个强大的工具,它允许开发者以编程方式控制事务,通过... 目录1. TransactionTemplate 的核心概念2. 核心接口和类3. TransactionT

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

深入理解C语言的void*

《深入理解C语言的void*》本文主要介绍了C语言的void*,包括它的任意性、编译器对void*的类型检查以及需要显式类型转换的规则,具有一定的参考价值,感兴趣的可以了解一下... 目录一、void* 的类型任意性二、编译器对 void* 的类型检查三、需要显式类型转换占用的字节四、总结一、void* 的

深入理解Redis大key的危害及解决方案

《深入理解Redis大key的危害及解决方案》本文主要介绍了深入理解Redis大key的危害及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、背景二、什么是大key三、大key评价标准四、大key 产生的原因与场景五、大key影响与危

深入理解C++ 空类大小

《深入理解C++空类大小》本文主要介绍了C++空类大小,规定空类大小为1字节,主要是为了保证对象的唯一性和可区分性,满足数组元素地址连续的要求,下面就来了解一下... 目录1. 保证对象的唯一性和可区分性2. 满足数组元素地址连续的要求3. 与C++的对象模型和内存管理机制相适配查看类对象内存在C++中,规

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。