书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战

2024-04-24 11:32

本文主要是介绍书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



1.2.2管道技术中的挑战

         阶段数对性能指标的影响虽然阶段多性能提升好,但阶段之间需要相互协调、传输信息,因此阶段越多这些协调同步机制越复杂,需要同步的信息量越大,越难以实现,比如魔兽争霸让多个农民去建造房屋,开始建造效率成倍增加,3人后效率明显减低。多个人刷房屋,如果房屋分配不均,人越多就需要等待结束的人越多。分析理想状态下4阶段和8阶段效率提升分析,如下图

                 

之前我们提到,每个阶段的命令执行时间要相同,这样命令在所有阶段的滞留时间都相同,从而各个阶段就刚好可以无缝配合,阶段1执行完毕后马上可以进入阶段2中,从而无时间浪费。想象一下,第一位病人刚好“看病”完毕,第二位也刚好挂号完毕,无需任何等待就直接进入“看病”阶段,这样就无缝的一直下去,看病的医生肯定很快就被如此高效的流程而累的头昏眼花。

         上述这个情况是理想情况,现实中每个阶段的执行时间肯定多少有差异,一般医生“看病”的时间最长,“挂号”的时间最短,因此总是在医生病房前排队等候。在CPU执行指令的几个阶段中,某些阶段需要的指令周期比其他阶段的需要的周期多,这个情况有个专门术语描述:管道延迟(pipeline stall),当处于这个状态时,此阶段后的其他阶段指令照常进行,之前的阶段需要等待此阶段执行完毕。这时就造成了时间的浪费。

         这里我们引入一个术语,指令潜伏期:指令通过管道所需的时钟周期数。理想情况下他的具体数值和管道的阶段数相同,4个阶段的管道,其指令潜伏期就为4,真实情况中因为每个阶段需要的时钟周期数不太可能刚好是1,因此就不太可能和阶段数量相同。

如何理解这个指令潜伏期呢?“指令潜伏期”从字面意思看,某个东西在潜伏期期间是无法被直接观察到的,否则就不叫潜伏,就像敌人无法发现潜伏的间谍,CPU指令可以想象成自来水管中的水,管道可以想象成自来水管道,自来水在水厂进入到管道后尚未在厨房流出前,因为我们没有透视眼的特异功能,看不到管道内部情况,就给我们造成水并未存在的假象;指令在管道中执行时,也就代表其指令未被执行完毕,因此这个指令的处理结果也就并未出现,给CPU的假象就是此指令不存在。

管道由多个阶段组成,需要相互配合才能完整执行完毕,因此各阶段之间是需要进行协调、配合的,如同步,相互协调的逻辑是比较复杂的,阶段越多越复杂,操作系统中程序间的同步就已经比较复杂了,CPU中的协调比这个要复杂。每个阶段执行的时间是不同的,差异越大,影响性能就越大,协调就越复杂,因此管道中阶段的划分最大的挑战是如何将每个阶段需要的时间尽可能的相同,从而降低管道延迟时间,提高性能,也因此很多CPU的管道划分信息属于商业机密。

借鉴同样的原理,我们利用多线程分部分执行以前作为整体处理的程序时,划分出的每个线程执行的时间要尽量相等,这样就可以充分利用多线程来提升效率。多线程的执行时间相等,并不简单的是执行的指令数相同,因为不同指令耗时不同,就像大战时,敌人都是一个团,一个是王牌团,一个是杂牌军,付出的代价是不同的,不能单单看对方的人数。在我们软件领域中一个典型情况是:假如要计算11000000的所有自然数之和,我们分10个线程执行,以提升效率,相信很多人第一想法就是每个线程负责10000个数值相加,然后将每个线程得到的结果相加就是最终结果,表面看每个线程都做10000个数加法,是相同的,但是个位数的相加需要的时间和6位数相加需要的时间是不同的,就造成多数线程已经执行完毕了,但是负责大自然数相加的线程才执行一半,从而并未达到最优效果,如果我们增加小自然数相加的线程需要负责的自然数数量,减少大自然相加线程负责的数量,就可以平衡执行时间。

100000自然数相加,线程时间不平衡造成的浪费图

 

这篇关于书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/931631

相关文章

C++中实现调试日志输出

《C++中实现调试日志输出》在C++编程中,调试日志对于定位问题和优化代码至关重要,本文将介绍几种常用的调试日志输出方法,并教你如何在日志中添加时间戳,希望对大家有所帮助... 目录1. 使用 #ifdef _DEBUG 宏2. 加入时间戳:精确到毫秒3.Windows 和 MFC 中的调试日志方法MFC

深入理解C++ 空类大小

《深入理解C++空类大小》本文主要介绍了C++空类大小,规定空类大小为1字节,主要是为了保证对象的唯一性和可区分性,满足数组元素地址连续的要求,下面就来了解一下... 目录1. 保证对象的唯一性和可区分性2. 满足数组元素地址连续的要求3. 与C++的对象模型和内存管理机制相适配查看类对象内存在C++中,规

在 VSCode 中配置 C++ 开发环境的详细教程

《在VSCode中配置C++开发环境的详细教程》本文详细介绍了如何在VisualStudioCode(VSCode)中配置C++开发环境,包括安装必要的工具、配置编译器、设置调试环境等步骤,通... 目录如何在 VSCode 中配置 C++ 开发环境:详细教程1. 什么是 VSCode?2. 安装 VSCo

使用Python检查CPU型号并弹出警告信息

《使用Python检查CPU型号并弹出警告信息》本教程将指导你如何编写一个Python程序,该程序能够在启动时检查计算机的CPU型号,如果检测到CPU型号包含“I3”,则会弹出一个警告窗口,感兴趣的小... 目录教程目标方法一所需库步骤一:安装所需库步骤二:编写python程序步骤三:运行程序注意事项方法二

C++11的函数包装器std::function使用示例

《C++11的函数包装器std::function使用示例》C++11引入的std::function是最常用的函数包装器,它可以存储任何可调用对象并提供统一的调用接口,以下是关于函数包装器的详细讲解... 目录一、std::function 的基本用法1. 基本语法二、如何使用 std::function

linux-基础知识3

打包和压缩 zip 安装zip软件包 yum -y install zip unzip 压缩打包命令: zip -q -r -d -u 压缩包文件名 目录和文件名列表 -q:不显示命令执行过程-r:递归处理,打包各级子目录和文件-u:把文件增加/替换到压缩包中-d:从压缩包中删除指定的文件 解压:unzip 压缩包名 打包文件 把压缩包从服务器下载到本地 把压缩包上传到服务器(zip

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

【C++ Primer Plus习题】13.4

大家好,这里是国中之林! ❥前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。有兴趣的可以点点进去看看← 问题: 解答: main.cpp #include <iostream>#include "port.h"int main() {Port p1;Port p2("Abc", "Bcc", 30);std::cout <<

C++包装器

包装器 在 C++ 中,“包装器”通常指的是一种设计模式或编程技巧,用于封装其他代码或对象,使其更易于使用、管理或扩展。包装器的概念在编程中非常普遍,可以用于函数、类、库等多个方面。下面是几个常见的 “包装器” 类型: 1. 函数包装器 函数包装器用于封装一个或多个函数,使其接口更统一或更便于调用。例如,std::function 是一个通用的函数包装器,它可以存储任意可调用对象(函数、函数

计组基础知识

操作系统的特征 并发共享虚拟异步 操作系统的功能 1、资源分配,资源回收硬件资源 CPU、内存、硬盘、I/O设备。2、为应⽤程序提供服务操作系统将硬件资源的操作封装起来,提供相对统⼀的接⼝(系统调⽤)供开发者调⽤。3、管理应⽤程序即控制进程的⽣命周期:进程开始时的环境配置和资源分配、进程结束后的资源回收、进程调度等。4、操作系统内核的功能(1)进程调度能⼒: 管理进程、线