linux驱动K10运算卡,GPU推动HPC普及,Tesla K10性能揭秘

2024-03-06 11:10

本文主要是介绍linux驱动K10运算卡,GPU推动HPC普及,Tesla K10性能揭秘,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

拼 命 加 载 中 ...

这两天时值国际超级计算大会,Intel推出了MIC多核架构的商品化品牌Xeon Phi,NVIDIA作为GPU计算阵营的代表也没闲着,也向公众展示了GPU计算在HPC领域的成就,并首次公开了Tesla K10的性能。

Top500的性能排名是基于Linpack Fortran矩阵数学测试而来的,这是一种双精度运算,不过实际应用中基于单精度的运算依然占相当大比例,这正是Tesla K10擅长的地方。

GPU计算卡在HPC中通常扮演协处理器的角色,它可以极大地提高HPC的峰值性能,四年前IBM“走鹃”计算机使用的就是AMD六核Optron处理器加IBM Cell协处理器的方式首次达到Petaflops千万亿级计算性能的。(国内的天河-1A也是处理器+协处理器的方式冲顶的,使用的协处理器就是NVIDIA Fermi架构的M2090计算卡)

c7fbdd2a1dc7b03791dde5e1d3e66d4a.png

NVIDIA在2007年正式推出Tesla计算卡,不过到2008年Tesla卡才具备基本的双精度计算能力。2010年发布的Tesla 20系列基于Fermi核心,支持GDDR5显存内ECC纠错,双精度性能也大幅提升,相比传统CPU方案,基于Tesla的HPC不仅更便宜,而且功耗更低,在散热和能耗上可以节省大笔投资。

2012年上半年的Top500超级计算机中有58套系统使用了协处理器设计,其中53套基于NVIDIA Tesla计算卡,2套使用AMD显卡,一套使用Intel刚刚定名的Xeon Phi处理器(ps:这才56套,还有2套是什么协处理器没提到)

9aabb5a6715fe2c5c0b0fd37779bc575.png

Top500中使用GPU协助计算的平台越来越多

排名前10的系统中有三套使用了Tesla计算卡,这一数值与一年前相比没有变化,11-50排名中有4套,翻了一倍,51-100的HPC中增加200%,而101-500的系统中数量增加了680%,用NVIDIA Tesla事业部高级产品经理Sumit Gupta的话说,“GPU使得HPC更加大众化,排名后400的系列中使用Tesla计算卡的系统达到前一年的8倍”。

他说实际上NVIDIA更关注的是不在Top500名单上的其他4000套HPC,NVIDIA的Tesla正在驱动HPC走向大众化。借助GPU的能力,一些规模较小的大学也构建Top500级别的小型计算中心。

为此,NVIDIA已经不再像上一代Fermi架构那样追求同步提升Tesla显卡的单精度和双精度性能,其中使用两颗GK104核心的Tesla K10主要面向单精度运算需求,浮点性能可达4.58TFLOPS,搭配8GB GDDR5显存。

基于GK110架构的Tesla K20主要面向双精度运算,双精度性能可达2TFlops,两倍于Intel刚刚宣布的Xeon Phi,二者都将在年底发布。

9c8dcd1f55e69f89f7aaafa27fa69795.png

K10上的每颗GPU都有160GB/s的带宽,整块显卡则有320GB/s的吞吐带宽,与50GB/s带宽的Sandy Bridge架构的Xeon E5-2600相比,K10达到后者的6.4倍之多,即便与前代177.6GB/s带宽的M2090相比也有近一倍提升。

说了这么多,来看看Tesla K10真正的计算性能吧,对比的是上一代的M2090,当然测试基本都是基于单精度运算的。

c9196d41d8badabac00b153ee762c0a1.png

K10展示出了强大的性能,整体大约是M2090的2-3倍。

其中,Amber是分子动力学模型软件,2009年时它在96颗X86处理器组成的服务器上花了一天时间才完成了23558个原子大约46ns(纳秒)的模拟运算,而使用8颗M2050计算卡一天内就可以完成52ns的运算,如果使用M2090则可以完成69ns的运算量。

到了今年,使用两颗K10计算卡就可以完成66ns的运算量,如果也使用8块K10运算的话那就可以完成四倍的运算量。

除了地震预测及分子动力学计算之外,K10同样也适用于卫星图像处理、视频增强、信号处理、计算机视觉、视频转码以及数字处理等领域,前提是对双精度运算要求不高。

这篇关于linux驱动K10运算卡,GPU推动HPC普及,Tesla K10性能揭秘的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/779874

相关文章

usb接口驱动异常问题常用解决方案

《usb接口驱动异常问题常用解决方案》当遇到USB接口驱动异常时,可以通过多种方法来解决,其中主要就包括重装USB控制器、禁用USB选择性暂停设置、更新或安装新的主板驱动等... usb接口驱动异常怎么办,USB接口驱动异常是常见问题,通常由驱动损坏、系统更新冲突、硬件故障或电源管理设置导致。以下是常用解决

Linux命令之firewalld的用法

《Linux命令之firewalld的用法》:本文主要介绍Linux命令之firewalld的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux命令之firewalld1、程序包2、启动firewalld3、配置文件4、firewalld规则定义的九大

Linux之计划任务和调度命令at/cron详解

《Linux之计划任务和调度命令at/cron详解》:本文主要介绍Linux之计划任务和调度命令at/cron的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux计划任务和调度命令at/cron一、计划任务二、命令{at}介绍三、命令语法及功能 :at

Linux下如何使用C++获取硬件信息

《Linux下如何使用C++获取硬件信息》这篇文章主要为大家详细介绍了如何使用C++实现获取CPU,主板,磁盘,BIOS信息等硬件信息,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录方法获取CPU信息:读取"/proc/cpuinfo"文件获取磁盘信息:读取"/proc/diskstats"文

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效

kali linux 无法登录root的问题及解决方法

《kalilinux无法登录root的问题及解决方法》:本文主要介绍kalilinux无法登录root的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录kali linux 无法登录root1、问题描述1.1、本地登录root1.2、ssh远程登录root2、

Linux ls命令操作详解

《Linuxls命令操作详解》通过ls命令,我们可以查看指定目录下的文件和子目录,并结合不同的选项获取详细的文件信息,如权限、大小、修改时间等,:本文主要介绍Linuxls命令详解,需要的朋友可... 目录1. 命令简介2. 命令的基本语法和用法2.1 语法格式2.2 使用示例2.2.1 列出当前目录下的文

Linux中的计划任务(crontab)使用方式

《Linux中的计划任务(crontab)使用方式》:本文主要介绍Linux中的计划任务(crontab)使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、前言1、linux的起源与发展2、什么是计划任务(crontab)二、crontab基础1、cro

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子