书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战

2024-04-24 11:32

本文主要是介绍书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



1.2.2管道技术中的挑战

         阶段数对性能指标的影响虽然阶段多性能提升好,但阶段之间需要相互协调、传输信息,因此阶段越多这些协调同步机制越复杂,需要同步的信息量越大,越难以实现,比如魔兽争霸让多个农民去建造房屋,开始建造效率成倍增加,3人后效率明显减低。多个人刷房屋,如果房屋分配不均,人越多就需要等待结束的人越多。分析理想状态下4阶段和8阶段效率提升分析,如下图

                 

之前我们提到,每个阶段的命令执行时间要相同,这样命令在所有阶段的滞留时间都相同,从而各个阶段就刚好可以无缝配合,阶段1执行完毕后马上可以进入阶段2中,从而无时间浪费。想象一下,第一位病人刚好“看病”完毕,第二位也刚好挂号完毕,无需任何等待就直接进入“看病”阶段,这样就无缝的一直下去,看病的医生肯定很快就被如此高效的流程而累的头昏眼花。

         上述这个情况是理想情况,现实中每个阶段的执行时间肯定多少有差异,一般医生“看病”的时间最长,“挂号”的时间最短,因此总是在医生病房前排队等候。在CPU执行指令的几个阶段中,某些阶段需要的指令周期比其他阶段的需要的周期多,这个情况有个专门术语描述:管道延迟(pipeline stall),当处于这个状态时,此阶段后的其他阶段指令照常进行,之前的阶段需要等待此阶段执行完毕。这时就造成了时间的浪费。

         这里我们引入一个术语,指令潜伏期:指令通过管道所需的时钟周期数。理想情况下他的具体数值和管道的阶段数相同,4个阶段的管道,其指令潜伏期就为4,真实情况中因为每个阶段需要的时钟周期数不太可能刚好是1,因此就不太可能和阶段数量相同。

如何理解这个指令潜伏期呢?“指令潜伏期”从字面意思看,某个东西在潜伏期期间是无法被直接观察到的,否则就不叫潜伏,就像敌人无法发现潜伏的间谍,CPU指令可以想象成自来水管中的水,管道可以想象成自来水管道,自来水在水厂进入到管道后尚未在厨房流出前,因为我们没有透视眼的特异功能,看不到管道内部情况,就给我们造成水并未存在的假象;指令在管道中执行时,也就代表其指令未被执行完毕,因此这个指令的处理结果也就并未出现,给CPU的假象就是此指令不存在。

管道由多个阶段组成,需要相互配合才能完整执行完毕,因此各阶段之间是需要进行协调、配合的,如同步,相互协调的逻辑是比较复杂的,阶段越多越复杂,操作系统中程序间的同步就已经比较复杂了,CPU中的协调比这个要复杂。每个阶段执行的时间是不同的,差异越大,影响性能就越大,协调就越复杂,因此管道中阶段的划分最大的挑战是如何将每个阶段需要的时间尽可能的相同,从而降低管道延迟时间,提高性能,也因此很多CPU的管道划分信息属于商业机密。

借鉴同样的原理,我们利用多线程分部分执行以前作为整体处理的程序时,划分出的每个线程执行的时间要尽量相等,这样就可以充分利用多线程来提升效率。多线程的执行时间相等,并不简单的是执行的指令数相同,因为不同指令耗时不同,就像大战时,敌人都是一个团,一个是王牌团,一个是杂牌军,付出的代价是不同的,不能单单看对方的人数。在我们软件领域中一个典型情况是:假如要计算11000000的所有自然数之和,我们分10个线程执行,以提升效率,相信很多人第一想法就是每个线程负责10000个数值相加,然后将每个线程得到的结果相加就是最终结果,表面看每个线程都做10000个数加法,是相同的,但是个位数的相加需要的时间和6位数相加需要的时间是不同的,就造成多数线程已经执行完毕了,但是负责大自然数相加的线程才执行一半,从而并未达到最优效果,如果我们增加小自然数相加的线程需要负责的自然数数量,减少大自然相加线程负责的数量,就可以平衡执行时间。

100000自然数相加,线程时间不平衡造成的浪费图

 

这篇关于书稿底稿)(C/C++)第一章:CPU基础知识 1.2.2管道技术中的挑战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/931631

相关文章

C++ move 的作用详解及陷阱最佳实践

《C++move的作用详解及陷阱最佳实践》文章详细介绍了C++中的`std::move`函数的作用,包括为什么需要它、它的本质、典型使用场景、以及一些常见陷阱和最佳实践,感兴趣的朋友跟随小编一起看... 目录C++ move 的作用详解一、一句话总结二、为什么需要 move?C++98/03 的痛点⚡C++

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

C++构造函数中explicit详解

《C++构造函数中explicit详解》explicit关键字用于修饰单参数构造函数或可以看作单参数的构造函数,阻止编译器进行隐式类型转换或拷贝初始化,本文就来介绍explicit的使用,感兴趣的可以... 目录1. 什么是explicit2. 隐式转换的问题3.explicit的使用示例基本用法多参数构造

C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解

《C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解》:本文主要介绍C++,C#,Rust,Go,Java,Python,JavaScript性能对比全面... 目录编程语言性能对比、核心优势与最佳使用场景性能对比表格C++C#RustGoJavapythonjav

C++打印 vector的几种方法小结

《C++打印vector的几种方法小结》本文介绍了C++中遍历vector的几种方法,包括使用迭代器、auto关键字、typedef、计数器以及C++11引入的范围基础循环,具有一定的参考价值,感兴... 目录1. 使用迭代器2. 使用 auto (C++11) / typedef / type alias

C++ scoped_ptr 和 unique_ptr对比分析

《C++scoped_ptr和unique_ptr对比分析》本文介绍了C++中的`scoped_ptr`和`unique_ptr`,详细比较了它们的特性、使用场景以及现代C++推荐的使用`uni... 目录1. scoped_ptr基本特性主要特点2. unique_ptr基本用法3. 主要区别对比4. u

C++11中的包装器实战案例

《C++11中的包装器实战案例》本文给大家介绍C++11中的包装器实战案例,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录引言1.std::function1.1.什么是std::function1.2.核心用法1.2.1.包装普通函数1.2.

C++多线程开发环境配置方法

《C++多线程开发环境配置方法》文章详细介绍了如何在Windows上安装MinGW-w64和VSCode,并配置环境变量和编译任务,使用VSCode创建一个C++多线程测试项目,并通过配置tasks.... 目录下载安装 MinGW-w64下载安装VS code创建测试项目配置编译任务创建 tasks.js

python协程实现高并发的技术详解

《python协程实现高并发的技术详解》协程是实现高并发的一种非常高效的方式,特别适合处理大量I/O操作的场景,本文我们将简单介绍python协程实现高并发的相关方法,需要的小伙伴可以了解下... 目录核心概念与简单示例高并发实践:网络请求协程如何实现高并发:核心技术协作式多任务与事件循环非阻塞I/O与连接

C++ 多态性实战之何时使用 virtual 和 override的问题解析

《C++多态性实战之何时使用virtual和override的问题解析》在面向对象编程中,多态是一个核心概念,很多开发者在遇到override编译错误时,不清楚是否需要将基类函数声明为virt... 目录C++ 多态性实战:何时使用 virtual 和 override?引言问题场景判断是否需要多态的三个关