日本百亿亿次超算曝光：性能提升100倍，2021年争第一

本文主要是介绍日本百亿亿次超算曝光：性能提升100倍，2021年争第一，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

640?wx_fmt=gif

640?wx_fmt=jpeg

新智元报道

来源：spectrum.ieee.org

编译：肖琴

【导读】日本欲重夺超算第一的行动初见端倪，近日，富士通等研究机构已经开始对下一代超算Post-K进行原型CPU的实地测试，研究者称，这台超算的应用性能将是前一代的100倍，达到百亿亿次级，计划在2021年推出。

日本计算机巨头富士通（Fujitsu）和日本最大的研究机构理化学研究所（RIKEN，简称理研）已经开始对下一代超级计算机的原型CPU进行实地测试，他们任务这款CPU将使日本在超级计算机的全球排名中重回领先地位。

这台下一代超级计算机被称为“Post-K超级计算机”（Post-K supercomputer），是继两家合作机构开发出8 petaflops的“京”超级计算机（K Computer）之后开发的。“京”自2012年开始在理化学研究所内运行，并已经升级到11 petaflops的峰值性能。2014年11月，全部组装完成后的京LINPACK性能达到10 PFLOPS（即每秒1京），创下了10.51 PFLOPS的纪录。京是首个达到10 PFLOPS性能的超算。

640?wx_fmt=jpeg

2012年推出的京超级计算机

富士通在最近的一份新闻稿中称，他们目标是“创造出世界上最高性能的超级计算机”，“其应用执行性能是京超级计算机的100倍”。他们计划在2021年前后在属于政府的理研中心安装这台加强型机器。

如果他们实现了这一执行速度，那么Post-K超算将进入百亿亿次级别（exascale），1 exaflops表示每秒一佰京/一亿亿亿（10¹⁸）次浮点运算。

640?wx_fmt=jpeg

Post-K超级计算机的原型单元包含2个Arm8A-SVE水冷CPU

为此，他们用Arm8A-SVE（可伸缩矢量扩展）512-bit架构取代了京超算的SPARC64 VIIIfx CPU，该架构已被增强为超级计算机使用，富士通和理研都参与了开发。

640?wx_fmt=jpeg

Post-K超算原型机的CPU package和CPU内存单元

新的设计在CPU上运行，计算节点具有48个核心和2个辅助核心，I/O及计算节点有48个核心外加4个辅助核心。系统结构每个节点使用1个CPU, 384个节点组成一个机架。

出于战略原因，富士通和理研都没有透露Post-K超算的节点总数。但是，位于神户的理研计算科学中心主任松冈聪（Satoshi Matsuoka）说，“这将是世界上最大的Arm系统，事实上，它可能是世界上最大的超级计算机。”

在系统互连方面，富士通采用了最初为京超算设计的Tofu 6D Mesh/Torus 拓扑结构。

640?wx_fmt=jpeg

Post-K采用的技术概要

松冈聪表示，除了采用新的CPU之外，Post-K在执行速度上的提升还来源于其他几个关键技术。内存带宽增加了“超过一个数量级”，网络带宽也显著增加。

此外，富士通还提高了京超算的双精度运算性能。富士通商业策略和开发部门的Koji Uchikawa解释说，为了提高应用程序的通用性，它还增加了对半精度浮点运算的支持，这种运算可以减少AI等应用程序的内存负载，在这些应用程序中，低精度是可以接受的。

除了采用Arm指令集架构外，富士通还与英国剑桥的Arm控股公司合作，该公司开发并授权Arm技术，以允许可伸缩矢量扩展实现新的指令。

此外，富士通还为这款芯片开发了自己的微架构。虽然处理器的指令集架构在硬件和软件之间进行接口以向处理器提供指令，但是它没有定义芯片的内部结构。相反，这是微架构的工作，因为它直接影响处理器的性能，富士通认为这将是一个对它有利的重要差异化因素。

理研和富士通在采用新架构时看到了其他一些优势，尤其是设计本身的节能特性，比如电源开关，可以在不需要CPU的时候降低某些元件的功率。富士通声称其耗电量仅为30到40兆瓦，而京超算的耗电量为12.7兆瓦，尽管Post-K的目标是在应用程序处理速度上相比京超算提高100倍。

640?wx_fmt=jpeg

京超算和Post-K的对比

富士通和理研都表示，它们也打算利用Arm的大型软件生态系统。“我们、富士通和其他合作伙伴将在高端服务器领域推动Arm生态系统，”理研的松冈聪说。他补充说，这将有助于富士通的商业成功，因为“不仅可以向外部公司出售他们的系统，还可以出售芯片”。

与此同时，富士通“将为京超算提供兼容的性能平衡，以便在重新编译后可以迁移当前的应用程序。”

最近，在美国橡树岭国家实验室新安装的超级计算机Summit，使美国重获超级计算机全球排名的榜首位置，这是六年来的首次。根据6月份的Top500榜单，Summit取得了122.3 petaflops的性能，中国的神威·太湖之光以93 petaflops的性能位居第二。劳伦斯利弗莫尔国家实验室的Sierra以71.6 petaflops排名第三。

因此，假如Post-K在2021年前后上线，不过到时，它将发现，争夺领先地位的竞争对手比比皆是。比如，中国的新一代百亿亿次超级计算机“天河三号”有望在2020年研制成功，并且其原型机早已亮相。不过，松冈对这种比较不屑一顾。“登上榜首不是我们关心的问题。对于大多数应用程序来说，Post-K可能表现出最快的解决时间和最大的可扩展性，因为它拥有出色的内存和网络带宽，以及出色的节能设计。”

毫无疑问，不久之后超算领域的竞争对手将会焕然一新。

640?wx_fmt=gif