(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念

本文主要是介绍(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



1.2.3    CORE内核

         处理器架构和核心微架构

         上面已经描述了,CPU被分为前端和后端,它们又被多个功能块(function block)组成,如:解码单元(decode unit)、预处理分支单元(branch-prediction unit)、整数单元(integer unit)、加载存储单元(load-store unit),这些单元又有其他小单元组成如复杂整数执行单元(complex integer unit)浮点计算单元(flating-point ALU)。

         微体系架构(microarchitecture)就是上面这些所有的单元组合了一起,也称为内核(core),一般CPU的内核包含了一级缓存L1,我们一般看CPU的概念图就会发现概念图上只会标注core、二级缓存L2以及其他功能单元,一级缓存因为整合到了core中,从而概念图上只标注了core而无L1,但大家不要误认为没有一级缓存,如AMD的概念图图。整个CPU是有内核CORE部分和其他辅助单元组成,就像航母战斗群,以各个航母为核心,每个航母配备一套战舰组成单独航母战斗单位,所有的航母战斗单位组成整个航母战斗群。我们可以将航母战斗群理解成完整的CPU,各个航母对应内核core,其辅助战舰就是其他各个单元。

一级缓存、前端、后端也就是内核部分和CPU中其他单元都是独立的,如COREL2L3和内存控制器(memorycontroler)是相互独立的。将内核和其他部分区分开,一般来说可以丰富产品的型号,比如现在流行的corei7系列CPU,有4款多型号,

 

1.2.4    多核概念

         多核处理器有2种存放方式(增加超线程 COREI7就用的HT

  1. 将多个CPU直接插到同一个计算机上,也就是主板上,供同一个操作系统使用。这样的架构,如果系统需要更多CPU,只需要在主板上再多插一个即可,一般这种技术只用在超级计算机、大型机和服务器上(增加这种图片

  2. CMPchipmultiprocessing:将多个CPU内核(core)设计制造到一个CPU中,从Core 2开始PC才有的这个技术

    CMP按照实际情况又分:

  1. Pentium D 每个core都有自己的L2,因此各个core之间并无共享的缓存,无法直接通信,只能通过总线通信,这个模式和我们小区很相似,我们小区只有两栋大楼,2个大楼之间没有直接连通,每个大楼都有自己单独的走廊和楼梯,因此如果另一栋楼里住着你的朋友,你想给他东西,双方就必须都走到小区的公园,才能交换东西。因此这种模式效率比较差,因为双方无法直接交换东西,只能走到大楼外,交换完东西再回去。同样,这样的CPUcore之间交换数据,都必须走出自己的L2,到公共的普通内存中交换数据,然后将数据放回自己的L2,再进行读取。具体CPU如何使用缓存读取信息在后面章节介绍,这里只需要了解他们会这么处理就好。

  2. 这种多核CPU整合度比较深入,其代表就是现在的酷睿系统的CPU,这种整合方法为:L1私有,因为上面我们说了L1属于内核部分,内核的组成单元都是私有的,L2为共有,因为L2公有,多核core都处理同一个L2,就可能出现同时写一块内存,或者一个写入未成功时另一个就进行读取,为了避免这些情况出现,CPU中内置了负责协调访问L2的内存控制单元。这种整合方式好处有:

第一:节约,绿色环保,每个L2都需要电压支撑才能工作,只有一个L2时,就节约了制造L2的材料和对应的电力需求;

第二:因为L2是共享的,因此core之间可以通过L2直接交互信息而不是通过总线,效率高,大幅增加了Cache的命中率;

第三:提升程序运行效率,当多个core执行程序时使用了同一段代码或数据,只需要在L2中维持一份拷贝边可以同时访问,访问需要同步的数据或者volatile变量时,不需要CPU每次访问都要在各个L2中进行数据同步。

第四:Intel采用了高智能cache技术,使得每个核心都可以动态支配100%的全部cache,如:某个内核对cache利用率很低,另一个内核就会动态增加L2的使用比率,最大程度高效使用缓存;

最新的Core i7 则是L1 L2私有,共用L3,如图

http://images.anandtech.com/reviews/cpu/intel/nehalem/review/Nehalem_Die_callout.jpg

在介绍第一种架构的范例中:小区存在的种种弊端,在911后,建筑设计师们已经意识到并进行了改进,很多新建筑都采用了“空中走廊”技术,各大楼在高层之间建立互联的通道,方便大楼之间走动并且提高发生灾难时的人员逃亡率。

现在,CPU中开始融合GPU,其融合的思路和我们上面介绍的多核原理相同,以前因为CPUGPU要通过主板利用总线通讯,这样的速度无论如何都比不上将GPU整合到CPU中,直接在CPU中通过共享的内存进行相互通讯的速度。典型的技术有AMDAPUIntelSandy Bridge技术,其融合的进展和上面介绍的步骤也大致相同,最开始的融合,就是比较生硬的直接将GPUCPU融合到同一个硅片中,通过内存控制器进行互相通信,目前的融合只是对这个方法进行了优化还处于低级阶段,严格说还未真正做到融合,就像夫妻刚结婚一样,大家只是住到同一个房子中,沟通确实方便了,但是存折啥的未共享,还是存在障碍。而真正的融合需要达到尽可能的完全共享,如:地址空间、完全融合的内存系统、线程并发等。AMD预计最少2014年才能基本达成高融合。

这篇关于(书稿底稿)(C/C++)第一章:CPU基础知识 1.2.3 CORE内核 1.2.4 多核概念的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/931632

相关文章

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

C++中初始化二维数组的几种常见方法

《C++中初始化二维数组的几种常见方法》本文详细介绍了在C++中初始化二维数组的不同方式,包括静态初始化、循环、全部为零、部分初始化、std::array和std::vector,以及std::vec... 目录1. 静态初始化2. 使用循环初始化3. 全部初始化为零4. 部分初始化5. 使用 std::a

C++ vector的常见用法超详细讲解

《C++vector的常见用法超详细讲解》:本文主要介绍C++vector的常见用法,包括C++中vector容器的定义、初始化方法、访问元素、常用函数及其时间复杂度,通过代码介绍的非常详细,... 目录1、vector的定义2、vector常用初始化方法1、使编程用花括号直接赋值2、使用圆括号赋值3、ve

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle

如何高效移除C++关联容器中的元素

《如何高效移除C++关联容器中的元素》关联容器和顺序容器有着很大不同,关联容器中的元素是按照关键字来保存和访问的,而顺序容器中的元素是按它们在容器中的位置来顺序保存和访问的,本文介绍了如何高效移除C+... 目录一、简介二、移除给定位置的元素三、移除与特定键值等价的元素四、移除满足特android定条件的元

Python获取C++中返回的char*字段的两种思路

《Python获取C++中返回的char*字段的两种思路》有时候需要获取C++函数中返回来的不定长的char*字符串,本文小编为大家找到了两种解决问题的思路,感兴趣的小伙伴可以跟随小编一起学习一下... 有时候需要获取C++函数中返回来的不定长的char*字符串,目前我找到两种解决问题的思路,具体实现如下:

C++ Sort函数使用场景分析

《C++Sort函数使用场景分析》sort函数是algorithm库下的一个函数,sort函数是不稳定的,即大小相同的元素在排序后相对顺序可能发生改变,如果某些场景需要保持相同元素间的相对顺序,可使... 目录C++ Sort函数详解一、sort函数调用的两种方式二、sort函数使用场景三、sort函数排序