刚出炉的TOP500 超级计算机榜单显示创纪录的34 套全新NVIDIA 加速系统,一口气将总数增加到87 套。

这只是第一步而已。六月份发表下一份榜单之际,采用NVIDIA 全新Volta GPU 架构的首批超级计算机,有部分即将上线。橡树岭国家实验室(ORNL)的 Summit 超级计算机,将会是全球运算能力最强大的超级计算机,不遑多让的还有美国劳伦斯利佛摩国家实验室(LLNL)的 Sierra 超级计算机和日本的人工智能桥接云基础设施(ABCI)。

本周全球最强大的超级计算机制造商齐聚在美国丹佛市举行的 SC17 大会,这三套超级计算机系统将成为注目焦点。

本周的SC17 大会举行了众多演讲和展览活动,能够藉此更深入了解GPU 与Volta架构将如何促进科学和人工智能领域的发展脚步。

人工智能延伸了HPC

Volta 较前一代Pascal 在效能方面增进五倍,它也跟Pascal 一样将人工智能和传统HPC 应用程序融合在单一平台上。

高性能计算(HPC)是现代科学发展的基础,让研究人员能模拟和预测真实世界可能出现的情况,像是人体对新式治疗药物的反应,或是崭新能源的效率。Volta 在结合人工智能和HPC 的情况下,让研究人员能运用人工智能更深究数据数据,以加快科学发现的脚步。

Summit、Sierra 与ABCI 皆采用 NVIDIA Tesla V100 GPU 加速器,一个GPU 便具有100个CPU 的运算能力,而耗电量只是前一代GPU 的一半。这三套超级计算机混合使用CPU 和GPU,均使用NVIDIA NVLink 高速互连技术进行连结。

藉由Summit 上升到新的高度

Summit 能够满足全球研究人员和科学家对于运算资源无穷尽的需求,预期最高运算效能达到200 petaflops(用在人工智能运算方面可超过3 exaflops),将可击败当前全球最强大的超级计算机,也就是中国的「神威.太湖之光」(Sunway TaihuLight),其最高运算效能为125.4 petaflops。Summit 的运算能力将是ORNL Titan 超级计算机的五倍多(Titan 始终称霸美国最强大超级计算机之冠)。

「我们并不太看重最高运算效能,而是藉由Summit 能在科学领域里达到什么样的发展程度。」ORNL 的国家运算科学中心科学运算组主管 Tjerk Straatsma 说。

Straatsma 表示研究人员可通过如此庞大的运算能力,解决规模更大更艰巨的难题、执行更精准的模拟内容和提出更正确的预测内容。举例来说,某项为Summit 规画的案子便是设计为预测气候变迁的长期效果,其它应用方式还包括加快药物研发的速度、让以植物为基础的燃油更具成本效益,或是让核融合成为干净充足的能源来源。

高速的Sierra

Sierra 是美国能源部用于管理和保护核武的主要系统,以及管理核武禁扩与反恐怖主义项目。预期最高运算效能可达125 petaflops,是LLNL 当前指令周期最快之Sequoia 系统的五到十倍。

LLNL 计算物理学助理项目主任Chris Clouse 表示科学家在如此庞大运算效能的助力下,将可执行高精度的模拟活动和运行3D 立体仿真项目,这是现今高效能计算机力所未逮的部分。

他说LLNL 还打算将Sierra 用在基础科学应用项目和人工智能研究上,让仿真内容更为完整准确。
橡树岭国家实验室的超级计算机项目包括这项CyberShake 地震灾害图,让工程师能获得所需信息,以设计发生地震时更为安全稳固的建筑结构。图片提供:南加州地震中心。

为人工智能设计

日本产业技术总合研究所(AIST)旗下的ABCI 将在2018年上线,成为全球人工智能创新平台。其规画的最高运算效能为37 petaflops,用于深度学习为550 petaflops,ABCI 将是日本国内最高速的超级计算机。

AIST 表示为人工智能、机器学习和深度学习量身打造的ABCI,将「加快将人工智能部署到实际商业和社会环境的脚步」。