并行计算课程和讲义-华东师范大学-数学科学学院

本文主要是介绍并行计算课程和讲义-华东师范大学-数学科学学院,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

并行计算

高等数值分析(高性能计算,并行计算)

(Parallel and High Performance Computing)

基本信息:
  • 教材:本课程主要讲授数值并行计算,内容以课堂讲义为主
  • 主要参考资料:

    并行计算与实现技术,迟学斌等,科学出版社,2015

    并行计算导论,张林波等, 清华大学出版社,2006

    Parallel Programming: Concepts and Practice, Schmidt et al, 2018 (并行程序设计: 概念与实践, 张常有等译, 2020)

    Parallel and High Performance Computing, Robey & Zamora, 2021 (并行计算与高性能计算, 殷海英译, 2022)

    The Art of High Performance Computing, Eijkhout, 2023

  • 远程客户端: SSH Secure Shell Client-3.2.9, SecureCRT

电子课件:
  • 02.27,并行计算介绍

    网络资源: Introduction to Parallel Computing Tutorial (Lawrence Livermore National Lab)

    计算机体系结构基础

    课外阅读: 第60届全球超级计算机TOP500排名及分析,2022.11


  • 03.06,Linux 操作系统介绍

    参考资料: Linux Command Quick Reference, Vi 简介, Vi 小结, vim cheat sheet

    Linux 就该这么学 (第 2 版), 刘遄, 2021

    Linux命令行与shell脚本编程大全 (第 4 版), Blum 等著, 2020, 门佳译, 2022

    网络资源: Linux 教程, Shell 教程, Linux 常用命令, Linux 命令搜索

    vim 入门基础, vi/vim 菜鸟教程

    CentOS/Ubuntu 下载: 上海交大FTP, 清华开源软件镜像, 阿里巴巴开源镜像, 网易开源镜像


  • 03.13,C 语言编程介绍 (示例代码)

    参考资料: C 语言程序设计笔记, C Reference Card, 常用头文件

    C Primer Plus (第 6 版), Prata 著, 2014, 姜佑译 2016, 涵盖 C11

    零基础学 C 语言 (第 4 版), 康莉等著, 2019

    网络资源: C 语言入门, C 语言教程, C reference, C 语言运算优先级, GCC docs online

    编译器: https://gcc.gnu.org, https://clang.llvm.org

  • 03.20,C 语言编程介绍 (续)

    应用举例: 矩阵乘积快速计算

    课外阅读: Why GEMM is at the heart of deep learning

    作业:用 C 语言编程实现矩阵乘积的各种不同算法, 并比较这些算法的计算效率.


  • 03.27,OpenMP并行编程(一)

    参考资料: Quick Card 4.0, Quick Card 5.0, Specification 4.0, Specification 5.0, OpenMP Examples 4.0.2

    网络资源: OpenMP 主页, OpenMP Tutorial (Lawrence Livermore National Lab)

    示例代码: OMP_hello.c, OMP_parallel_01.c, OMP_parallel_02.c

    OMP_for.c, OMP_parallel_for.c, OMP_for_schedule.c

    OMP_pi.c, OMP_pi_critical.c, OMP_pi_for.c

  • 04.03,OpenMP并行编程(二)

    示例代码: OMP_sections.c, OMP_critical_pi.c, OMP_atomic_01.c, OMP_atomic_02.c

  • 04.10,OpenMP并行编程(三)

    示例代码: OMP_lock.c, OMP_lock_pi.c, OMP_lock_atomic_critical.c

    作业:实现 Jacobi 迭代算法的 OpenMP 并行计算.


  • 04.17,矩阵-向量乘积并行算法,  矩阵-矩阵乘积并行算法

    示例代码: C_MatVec_for.c, OMP_MatVec_for.c, OMP_MatVec_row.c

    OMP_MatMul_for.c, OMP_MatMul_row.c

  • 04.24,线性方程组直接法并行计算

    示例代码: C_LU.c

    作业:实现部分选主元 LU 分解的串行算法和 OpenMP 并行算法.


  • 05.01,五一放假
  • 05.08,消息传递编程接口 MPI:(一)编程基础

    参考资料: MPI 3.1 Report (2015), MPI 4.0 Report (2021), 被替换的 MPI 旧函数 (2021)

    网络资源: MPI-Forum, mpitutorial

    MPI 实现: MPICH, OpenMPI

    示例代码: MPI_hello.c, MPI_pi.c

    MPI_Sendrecv_01.c, MPI_Sendrecv_02.c, MPI_Sendrecv_03.c, MPI_Sendrecv_04.c

  • 05.15,消息传递编程接口 MPI:(二)消息传递

    示例代码: MPI_pi_reduce.c

    作业:使用 reduce 计算 pi 的值,连续分配计算小区间.

  • 05.22/29,基于 MPI 的矩阵向量乘积,   基于 MPI 的矩阵矩阵乘积

    示例代码: MPI_matvec.c, MPI_matvec_v.c, MPI_matvec_swap.c

    MPI_matmul.c, MPI_matmul_swap.c

  • 06.05,消息传递编程接口 MPI:(三)MPI 数据类型

    消息传递编程接口 MPI:(四)进程与通信器操作

    基于 MPI 的 LU 分解

  • 06.12,基于 MPI 的二维 Poisson 方程求解

    示例代码: jacobi.c, MPI_jacobi.c


参考资料:
  • Pacheco 著,邓倩妮等译,并行程序设计导论(An Introduction to Parallel Programming),机械工业出版社,2012
  • 李晓梅等著,数值并行算法与软件,科学出版社,2014
  • 陈国良, 《并行计算: 结构、算法与编程》第二版, 高等教育出版社, 2003
  • 陈国良, 安虹等,《并行算法实践》, 高等教育出版社, 2004.
  • J. Dongarra等著, 莫则尧等译, 《并行计算综论》, 电子工业出版社, 2005(英文版2003)
  • Introduction To Parallel Computing (中文翻译)

OpenMP/MPI

  • M. Quinn著, 陈文光等译, 《MPI与OpenMP并行程序设计(C语言版)》, 清华大学出版社, 2004
  • 秋明等著, OpenMP编译原理及实现技术, 清华大学出版社, 2012.
  • 张武生等, 《MPI并行程序设计实例教程》, 清华大学出版社, 2009.
  • M. Snir, et al, 《MPI: The Complete Reference》, 1996, 2nd 2001.
  • W. Gropp, et al, 《MPI: The Complete Reference, Vol.2, MPI-2 Extensions》, 1998.
  • W. Gropp, et al, 《Using MPI: Portable Parallel Programming With the Message-passing Interface》, 2nd, 1999.
  • MPI Turorial
  • MPI2 介绍(中文)

Fortran

  • S.J. Chapman 著, 《Fortran 95/2003程序设计》(第3版), 中国电力出版社, 2009.
  • I. Chivers, J. Sleightholme, Introduction to Programming with Fortran, 2nd, 2012
    (中译本, Fortran权威指南, 第一版, 2009)

GPU

  • J. Sander 等著, 《GPU高性能编程CUDA实战》, 机械工业出版社, 2012.
  • R. Farber 著, 《高性能CUDA应用设计与开发:方法与最佳实践》, 机械工业出版社, 2013.
  • A. Munshi 等著, 《OpenCL编程指南》, 机械工业出版社, 2012.

并行程序编程实现:
  • MPI:   MPI Forum,   MPICH,   Open MPI (原 LAM)
  • MVAPICH -- MPI over InfiniBand and iWARP
  • PVM - Parallel Virtual Machine
  • OpenMP 一个共享存储并行系统上的应用编程接口
  • HPF - High Performance Fortran

  • 中科院超级计算中心 (超级计算环境基础并行软件平台建设与应用)
  • Top 500 supercomputer (浮点运算性能)
  • Graph 500 supercomputer (在数据密集型应用上的性能)
  • Netlib (国内镜像) Collection of Mathematical Software, Papers and Database
  • PETSc: Portable, Extensible Toolkit for Scientific Computation

Last modified: Sep. 1, 2019

这篇关于并行计算课程和讲义-华东师范大学-数学科学学院的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/924507

相关文章

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

uva 10025 The ? 1 ? 2 ? ... ? n = k problem(数学)

题意是    ?  1  ?  2  ?  ...  ?  n = k 式子中给k,? 处可以填 + 也可以填 - ,问最小满足条件的n。 e.g k = 12  - 1 + 2 + 3 + 4 + 5 + 6 - 7 = 12 with n = 7。 先给证明,令 S(n) = 1 + 2 + 3 + 4 + 5 + .... + n 暴搜n,搜出当 S(n) >=

uva 11044 Searching for Nessy(小学数学)

题意是给出一个n*m的格子,求出里面有多少个不重合的九宫格。 (rows / 3) * (columns / 3) K.o 代码: #include <stdio.h>int main(){int ncase;scanf("%d", &ncase);while (ncase--){int rows, columns;scanf("%d%d", &rows, &col

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

CSP-J基础之数学基础 初等数论 一篇搞懂(一)

文章目录 前言声明初等数论是什么初等数论历史1. **古代时期**2. **中世纪时期**3. **文艺复兴与近代**4. **现代时期** 整数的整除性约数什么样的整数除什么样的整数才能得到整数?条件:举例说明:一般化: 判断两个数能否被整除 因数与倍数质数与复合数使用开根号法判定质数哥德巴赫猜想最大公因数与辗转相除法计算最大公因数的常用方法:举几个例子:例子 1: 计算 12 和 18

2024年AMC10美国数学竞赛倒计时两个月:吃透1250道真题和知识点(持续)

根据通知,2024年AMC10美国数学竞赛的报名还有两周,正式比赛还有两个月就要开始了。计划参赛的孩子们要记好时间,认真备考,最后冲刺再提高成绩。 那么如何备考2024年AMC10美国数学竞赛呢?做真题,吃透真题和背后的知识点是备考AMC8、AMC10有效的方法之一。通过做真题,可以帮助孩子找到真实竞赛的感觉,而且更加贴近比赛的内容,可以通过真题查漏补缺,更有针对性的补齐知识的短板。

《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》P98

更改为 差分的数学表达式从泰勒级数展开式可得: 后悔没听廖老师的。 禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》 禹晶、肖创柏、廖庆敏《数字图像处理》资源二维码

一些数学经验总结——关于将原一元二次函数增加一些限制条件后最优结果的对比(主要针对公平关切相关的建模)

1.没有分段的情况 原函数为一元二次凹函数(开口向下),如下: 因为要使得其存在正解,必须满足,那么。 上述函数的最优结果为:,。 对应的mathematica代码如下: Clear["Global`*"]f0[x_, a_, b_, c_, d_] := (a*x - b)*(d - c*x);(*(b c+a d)/(2 a c)*)Maximize[{f0[x, a, b,

2024年高教社杯数学建模国赛最后一步——结果检验-事关最终奖项

2024年国赛已经来到了最后一天,有必要去给大家讲解一下,我们不需要过多的去关注模型的结果,因为模型的结果的分值设定项最多不到20分。但是如果大家真的非常关注的话,那有必要给大家讲解一下论文结果相关的问题。很多的论文,上至国赛优秀论文下至不获奖的论文并不是所有的论文都可以进行完整的复现求解,大部分数模论文都为存在一个灰色地带。         白色地带即认为所有的代码均可运行、公开