首台E级超算登顶Top500榜单:算力超过后七名之和

简介: 首台E级超算登顶Top500榜单:算力超过后七名之和

5 月 30 日,第 59 届 ISC 2022(国际超算大会)发布最新 Top500 榜单,美国田纳西州橡树岭国家实验室(ORNL)的 Frontier 成为第一个真正突破 Exascale 大关的超算,性能达到 1.102 exaflops,该榜单正式标志着超级计算新时代的到来。


Frontier 超算突破 Exaflops

Frontier 由 74 个 Cray EX 机柜组成,可容纳 9408 个节点,每个节点配备一个 AMD Milan「Trento」7A53 Epyc CPU 和四个 AMD Instinct MI250X GPU,GPU 总数为 37632。节点通过 HPE 的 Slingshot-11 互连连接。每个节点 CPU 支持 512GiB DDR4 内存,跨节点支持 512GiB HMB2e(每 GPU 128GiB)内存。


Frontier 的 Linpack 性能为 1.102 exaflops,比 Top500 中的排名靠前的 7 个系统加起来还要快。来自田纳西州橡树岭国家实验室的 Thomas Zacharia 表示:「我们不能低估 0.1 的差距,一个 0.1 代表 100petaflops,0.1 看起来很小,很容易被四舍五入。但每个小数点都代表着一种巨大的能力。」


Frontier 在 OLCF(美国橡树岭国家实验室领先运算机构)占地 372 平方米,聚合了 9.2 PB 的内存(4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e),有 37 PB 的节点本地存储,并可访问 716 PB 的中心范围存储。

Top10 榜单

四次登顶的日本超算富岳本次排在第二位,性能 442 petaflops,其采用 Arm A64FX 系统。

部署在芬兰国家超算中心的 LUMI 排名第三,使其成为欧洲最强大超算系统。LUMI 实现了 151.90 Linpack petaflops,理论峰值可达到 214.3 petaflops,这个数字大约为 71% 的 Linpack 效率。

IBM 的 Summit 排名第四、Sierra 排名第五;中国的神威太湖之光排名第六;美国劳伦斯伯克利实验室的国家能源研究科学计算中心(NERSC) 的 Perlmutter HPE Cray EX 排名第七;紧随其后的是英伟达 Selene 排在第八位;中国的天河 2A 排名第九。

部署在法国国家大型计算中心的 Adastra 系统排名第十,其 Linpack 实现 46.1 Linpack petaflops,理论峰值为 61.6 千万亿次,Linpack 效率为 75%。

值得一提的是,Top10 中新上榜的 3 台新系统(美国的 Frontier、芬兰的 LUMI 和 法国的 Adastra)都是采用了 HPE Cray EX235a 架构


仅仅在四年前,也就是 2018 年 6 月,整个 Top500 榜单首次以 1.22 exaflops 的总和超过 exaflops 大关。现在 Frontier 的单个系统算力就达到了 1.102 Exaflops。

本次 Top500 榜单共迎来 39 个新系统,地域分布广泛。美国最多,有 9 个,其次是德国的 5 个。近十年来,中国首次没有新系统上榜,尽管如此,中国仍然拥有列表中最多的系统:173 个,而美国系统数量为 127 个,就系统数量而言,美国位居第二。然而,美国由于 Frontier 的性能显着拉长了领先优势。


中国的超算进展

在国内的超级计算机计划中已有三个 E 级超算上马,这些系统本质上不是由 Top500 或 HPL 基准验证的,而是由戈登贝尔奖。其中一个是无锡超级计算中心运营的神威太湖之光(新机位于青岛)。

另一个系统天河三号位于天津市。Tianhe-3 基于 Phytium 2000+ FTP Arm 芯片和 Matrix 2000+ MTP 加速器。该系统据报道已于去年秋天完成,估计可以提供 1.7 exaflops 的峰值性能,在 Linpack 上提供了略高于 1.3 exaflops 的性能。

在汉堡举行的 ISC 2022 之前,有消息人士表示,中国正计划在 2025-2026 年的时间范围内制造一台 10 exaflops 的机器。另有消息人士称,有两台目标 2025 年上线的 10 exaflops 系统正在开发中,但现在更大的可能是在 2026 年只推出一台 10 exaflops 系统。与太湖之光一样,它将是神威架构,即基于 Alpha 核心。

上海交通大学网络信息中心副主任,HPC 专家林新华表示,Top500 已成为事实上的实体名单。「中国顶级超级计算机的供应商和主机中心都在名单上,」他表示。「进入 Top500 是为了促进国际合作,但结果却适得其反。我们提交 Top500 并不是为了维持联系。」

近年来,在 Top500 基准上的几家中国系统的支持实体和供应商确实被列入了美国实体名单。

技术供应商

联想是 Top500 榜单上的常客,其参与基准测试的新系统数量最多(17 个),在 14 个新系统中,HPE 的数量位居第二(其中 7 个采用 AMD+AMD 节点,通过 Slingshot-11 连接,包括 三个 NNSA/LLNL 系统)。在所有 500 个系统中,按纯系统数量计算的阵容是联想(180 个)、HPE(84 个)和浪潮(50 个)。按性能份额比较的话,排名依次为:HPE(18.6%)、富士通(18.1%)和联想(15.1%)。

名单上没有新的英伟达系统。其自用的 Eos 超算将会展示它的最新实力,但为 Eos 提供算力的 DGX H100 节点预计直到下个季度才会发货。


英伟达是该列表中 19 个系统的制造商,并且它合作参与了另外 5 个系统的构建,包括第五位的 Sierra、第 22 位的 Chervonenkis 、第 30 位的 Lassen、第 40 位的 Galushkin 和第 43 位的 Lyapunov。

英特尔声称在 Top500 排行榜中占有 77.40% 的份额,这个数字低于六个月前的 81.60%。AMD 共有 94 个系统,在该列表中的份额已从六个月前的 14.60% 增长到 18.80%。

IBM 的超算数量仍然未变是 9 个:第 4 名的 Summit、第 5 名的 Sierra、第 21 名的 Marconi-100、第 30 名的 Lassen、第 33 名的 PANGEA II、第 24 名的 AiMOS、第 160 名的 HPC2 第 205 名的 SuperMUC Phase2(与联想合作)和第 303 名的 Longhorn。

参考内容:https://www.top500.org/news/ornls-frontier-first-to-break-the-exaflop-ceiling/

相关文章
|
Kubernetes 监控 测试技术
k8s中蓝绿部署、金丝雀发布、滚动更新汇总
k8s中蓝绿部署、金丝雀发布、滚动更新汇总
|
异构计算
CCF推荐B类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
中国计算机学会(CCF)定期发布国际学术会议和期刊目录,为科研人员提供参考。本文总结了计算机体系结构、并行与分布计算、存储系统领域的CCF推荐B类会议和期刊,包括会议和期刊的全称、出版社、dblp文献网址及领域分类。会议涵盖了SoCC、SPAA、PODC等26项重要国际会议,期刊则包括TAAS、TODAES、TECS等9种权威期刊,为相关领域的研究者提供了宝贵的资源。
CCF推荐B类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
|
5月前
|
数据采集 边缘计算 定位技术
ar景区导航导览开发方案:核心技术架构与功能设计
本方案针对传统景区导航吸引力弱、互动性差等问题,融合三维建模、多源定位与AR引擎技术,实现室内外精准导航与AR互动体验。支持AR寻宝等功能,提升游客体验与景区竞争力。
420 0
|
机器学习/深度学习 人工智能 芯片
【AI系统】超异构计算
本文探讨了计算机架构发展的黄金十年,重点介绍了异构计算和超异构计算的概念及其在AI芯片发展中的应用。文章首先回顾了AI芯片发展的三个阶段,随后详细阐述了异构计算的优势和应用场景,如性能飞跃、灵活定制、降低成本和降低功耗。接着,文章分析了超异构计算的出现背景、基本特征及其面临的挑战,包括软件层的复杂性和硬件定义软件与软件定义硬件之间的权衡。最后,展望了超异构计算的未来,强调了跨平台统一计算架构的重要性,以及构建开放生态系统的必要性。
711 5
|
10月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【卷积层】| CVPR-2023 SCConv 空间和通道重建卷积:即插即用,减少冗余计算并提升特征学习
YOLOv11改进策略【卷积层】| CVPR-2023 SCConv 空间和通道重建卷积:即插即用,减少冗余计算并提升特征学习
309 0
YOLOv11改进策略【卷积层】| CVPR-2023 SCConv 空间和通道重建卷积:即插即用,减少冗余计算并提升特征学习
|
分布式计算 API Apache
Dask与Apache Spark的对比
【8月更文挑战第10天】随着数据量激增,高效处理成为关键。本文对比了Python领域的两大工具——Dask与Apache Spark。Dask提供类似NumPy和Pandas的API,适用于中小规模数据;而Spark作为内存型处理引擎,擅长超大规模数据处理。我们通过代码实例展示了两者的使用方式,并分析了它们在性能、API及生态系统方面的异同。无论您追求易用性还是高性能,都能从中找到合适的选择。
|
机器学习/深度学习 运维 监控
智能运维的崛起:机器学习在故障预测中的应用
随着信息技术的快速发展,传统的运维模式已无法满足现代企业的需求。本文将探讨如何利用机器学习技术进行故障预测,以实现智能运维。我们将通过数据分析和实验结果来展示机器学习在故障预测中的有效性,并讨论其在实际运维中的应用前景。
325 27
Windows 命令提示符(CMD)操作(一):文件和目录管理
Windows 命令提示符(CMD)操作(一):文件和目录管理
|
Kubernetes Cloud Native API
云原生技术专题 | 深入浅出分析云原生微服务的技术结构和架构设计
云原生技术专题 | 深入浅出分析云原生微服务的技术结构和架构设计
856 0
|
XML 前端开发 JavaScript
SpringBoot接手JSP项目–【JSB项目实战】
SpringBoot接手JSP项目–【JSB项目实战】 CSDN 转过来的,所以格式与内容有些许错误请见谅
SpringBoot接手JSP项目–【JSB项目实战】