【并行计算】【《并行程序设计导论》笔记】第一章:为什么要并行计算

2024-04-29 01:20

本文主要是介绍【并行计算】【《并行程序设计导论》笔记】第一章:为什么要并行计算,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 1.1|为什么需要不断提升的性能
      • 1.2|为什么需要构建并行系统
        • 单处理器性能提升
      • 1.3|为什么需要编写并行程序
        • 串行代码与并行代码
          • 串行代码
          • 并行代码
      • 1.4|怎样编写并行程序
        • 任务并行与数据并行
          • 任务并行
          • 数据并行
      • 1.5|我们将做什么
        • 共享内存系统与分布式内存系统
          • 共享内存系统
          • 分布式内存系统
      • 1.6|并发、并行、分布式

因上努力

个人主页:丷从心·

系列专栏:并行计算

果上随缘


1.1|为什么需要不断提升的性能


1.2|为什么需要构建并行系统

单处理器性能提升
  • 单处理器性能大幅度提升的主要原因之一,是日益增加的集成电路晶体管密度
  • 随着晶体管尺寸的减小,晶体管的传递速度增快,集成电路整体的速度也增快
  • 但是,随着晶体管速度的增快,它们的能耗也相应增加,大多数能量是以热能的形式消耗,当一块集成电路变得太热的时候,就会变得不可靠
  • 21 21 21世纪的第一个 10 10 10年中,用空气冷却的集成电路的散热能力已经达到了极限

1.3|为什么需要编写并行程序

串行代码与并行代码
串行代码
sum = 0;
for (i = 0; i < n; i++)
{x = Compute_next_value(...);sum += x;
}
并行代码
  • 假设有 p p p个核,且 p p p远小于 n n n,那么每个核能够计算大约 n / p n / p n/p个数的值并累加求和
my_sum = 0;
my_first_i = ...;
my_last_i = ...;
for (my_i = my_first_i; my_i < my_last_i; my_i++)
{my_x = Compute_next_value(...);my_sum += my_x;
}
  • 当各个核都计算完各自的my_sum值后,将自己的结果值发送给一个指定为“ m a s t e r master master”的核, m a s t e r master master核将收到的部分和累加而得到全局总和
if (I'm the master core)
{sum = my_x;for each core other than myself{receive value from core;sum += value;}
}
else
{send my_x to the master;
}
  • 当核的数目比较多的时候,将各个核两两结对

1.4|怎样编写并行程序

任务并行与数据并行
任务并行
  • 任务并行是将待解决问题所需要执行的各个任务分配到各个核上执行
数据并行
  • 数据并行是指将待解决问题所需要处理的数据分配给各个核,每个核在分配到的数据集上执行大致相似的操作

1.5|我们将做什么

共享内存系统与分布式内存系统
共享内存系统
  • 在共享内存系统中,各个核能够共享访问计算机的内存,理论上每个核能够读、写内存的所有区域
分布式内存系统
  • 在分布式内存系统中,每个核都拥有自己的私有内存,核之间的通信是显式的

1.6|并发、并行、分布式


这篇关于【并行计算】【《并行程序设计导论》笔记】第一章:为什么要并行计算的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/944763

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry

基于51单片机的自动转向修复系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 单片机

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

SprinBoot+Vue网络商城海鲜市场的设计与实现

目录 1 项目介绍2 项目截图3 核心代码3.1 Controller3.2 Service3.3 Dao3.4 application.yml3.5 SpringbootApplication3.5 Vue 4 数据库表设计5 文档参考6 计算机毕设选题推荐7 源码获取 1 项目介绍 博主个人介绍:CSDN认证博客专家,CSDN平台Java领域优质创作者,全网30w+

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit