日本百亿亿次超算曝光:性能提升100倍,2021年争第一

2024-04-12 19:58

本文主要是介绍日本百亿亿次超算曝光:性能提升100倍,2021年争第一,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=gif

640?wx_fmt=jpeg




  新智元报道  

来源:spectrum.ieee.org

编译:肖琴


【导读】日本欲重夺超算第一的行动初见端倪,近日,富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试,研究者称,这台超算的应用性能将是前一代的100倍,达到百亿亿次级,计划在2021年推出。


日本计算机巨头富士通(Fujitsu)和日本最大的研究机构理化学研究所(RIKEN,简称理研)已经开始对下一代超级计算机的原型CPU进行实地测试,他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。


这台下一代超级计算机被称为“Post-K超级计算机”(Post-K supercomputer),是继两家合作机构开发出8 petaflops的“京”超级计算机(K Computer)之后开发的。“京”自2012年开始在理化学研究所内运行,并已经升级到11 petaflops的峰值性能。2014年11月,全部组装完成后的京LINPACK性能达到10 PFLOPS(即每秒1京),创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。


640?wx_fmt=jpeg

2012年推出的京超级计算机


富士通在最近的一份新闻稿中称,他们目标是“创造出世界上最高性能的超级计算机”,“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。


如果他们实现了这一执行速度,那么Post-K超算将进入百亿亿次级别(exascale),1 exaflops表示每秒一佰京/一亿亿亿(1018)次浮点运算。


640?wx_fmt=jpeg

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU


为此,他们用Arm8A-SVE(可伸缩矢量扩展)512-bit架构取代了京超算的SPARC64 VIIIfx CPU,该架构已被增强为超级计算机使用,富士通和理研都参与了开发。


640?wx_fmt=jpeg

Post-K超算原型机的CPU package和CPU内存单元


新的设计在CPU上运行,计算节点具有48个核心和2个辅助核心,I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。


出于战略原因,富士通和理研都没有透露Post-K超算的节点总数。但是,位于神户的理研计算科学中心主任松冈聪(Satoshi Matsuoka)说,“这将是世界上最大的Arm系统,事实上,它可能是世界上最大的超级计算机。”


系统互连方面,富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。


640?wx_fmt=jpeg

Post-K采用的技术概要


松冈聪表示,除了采用新的CPU之外,Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”,网络带宽也显著增加。


此外,富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说,为了提高应用程序的通用性,它还增加了对半精度浮点运算的支持,这种运算可以减少AI等应用程序的内存负载,在这些应用程序中,低精度是可以接受的。


除了采用Arm指令集架构外,富士通还与英国剑桥的Arm控股公司合作,该公司开发并授权Arm技术,以允许可伸缩矢量扩展实现新的指令。


此外,富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令,但是它没有定义芯片的内部结构。相反,这是微架构的工作,因为它直接影响处理器的性能,富士通认为这将是一个对它有利的重要差异化因素。


理研和富士通在采用新架构时看到了其他一些优势,尤其是设计本身的节能特性,比如电源开关,可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦,而京超算的耗电量为12.7兆瓦,尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。


640?wx_fmt=jpeg

京超算和Post-K的对比


富士通和理研都表示,它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统,”理研的松冈聪说。他补充说,这将有助于富士通的商业成功,因为“不仅可以向外部公司出售他们的系统,还可以出售芯片”。


与此同时,富士通“将为京超算提供兼容的性能平衡,以便在重新编译后可以迁移当前的应用程序。”


最近,在美国橡树岭国家实验室新安装的超级计算机Summit,使美国重获超级计算机全球排名的榜首位置,这是六年来的首次。根据6月份的Top500榜单,Summit取得了122.3 petaflops的性能,中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。


因此,假如Post-K在2021年前后上线,不过到时,它将发现,争夺领先地位的竞争对手比比皆是。比如,中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功,并且其原型机早已亮相。不过,松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说,Post-K可能表现出最快的解决时间和最大的可扩展性,因为它拥有出色的内存和网络带宽,以及出色的节能设计。”


毫无疑问,不久之后超算领域的竞争对手将会焕然一新。

640?wx_fmt=gif

640?wx_fmt=png


点击下方“阅读原文”了解云创大数据诚征公安行业总代理事宜 ↓↓↓

这篇关于日本百亿亿次超算曝光:性能提升100倍,2021年争第一的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/898098

相关文章

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

java学习,进阶,提升

http://how2j.cn/k/hutool/hutool-brief/1930.html?p=73689

JAVA用最简单的方法来构建一个高可用的服务端,提升系统可用性

一、什么是提升系统的高可用性 JAVA服务端,顾名思义就是23体验网为用户提供服务的。停工时间,就是不能向用户提供服务的时间。高可用,就是系统具有高度可用性,尽量减少停工时间。如何用最简单的方法来搭建一个高效率可用的服务端JAVA呢? 停工的原因一般有: 服务器故障。例如服务器宕机,服务器网络出现问题,机房或者机架出现问题等;访问量急剧上升,导致服务器压力过大导致访问量急剧上升的原因;时间和

PR曲线——一个更敏感的性能评估工具

在不均衡数据集的情况下,精确率-召回率(Precision-Recall, PR)曲线是一种非常有用的工具,因为它提供了比传统的ROC曲线更准确的性能评估。以下是PR曲线在不均衡数据情况下的一些作用: 关注少数类:在不均衡数据集中,少数类的样本数量远少于多数类。PR曲线通过关注少数类(通常是正类)的性能来弥补这一点,因为它直接评估模型在识别正类方面的能力。 精确率与召回率的平衡:精确率(Pr

GPU 计算 CMPS224 2021 学习笔记 02

并行类型 (1)任务并行 (2)数据并行 CPU & GPU CPU和GPU拥有相互独立的内存空间,需要在两者之间相互传输数据。 (1)分配GPU内存 (2)将CPU上的数据复制到GPU上 (3)在GPU上对数据进行计算操作 (4)将计算结果从GPU复制到CPU上 (5)释放GPU内存 CUDA内存管理API (1)分配内存 cudaErro

SQL2005 性能监视器计数器错误解决方法

【系统环境】 windows 2003 +sql2005 【问题状况】 用户在不正当删除SQL2005后会造成SQL2005 性能监视器计数器错误,如下图 【解决办法】 1、在 “开始” --> “运行”中输入 regedit,开启注册表编辑器,定位到 [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVer