【黄教主再放核弹】英伟达超级计算机SaturnV升级,有望杀入Top500榜单前五

简介: 最新一期国际超算权威榜单Top500发布,英伟达的DGX SaturnV 排名第36。就在昨天,英伟达宣布,使用最新的Volta升级该集群,一个DGX SaturnV里组装了660个DGX-1节点(每个节点8个V100芯片)。如果你把GPU从SaturnV中拿出来一个一个挨着放,差不多能排上一公里。

2017年超算大会,最新Top500榜单公布,但这里要说的不是中国的强力表现——虽然还是让我们简单回顾一下,中国上榜的超级计算机系统数量超越了美国(202 vs 143),神威·太湖之光和天河二号第四次蝉联冠亚军——而是英伟达。

ce69a9f03a8b58ea294f2089ce5acd727f086adb

最新的Top500超级计算机榜单中,英伟达的DGX SaturnV 系统排名第36。此外,榜单上有34个系统使用了他家的GPU。不仅如此,在全球Top20最高效的超级计算机集群中,有14个使用了英伟达的硬件。如果这还不够,该公司现在宣布,DGX SaturnV集群升级,使用最新的Tesla V100芯片。

单块Tesla V100芯片的规格令人印象深刻:有21亿个晶体管(1455 MHz),5120个流处理器,16 GB的封装HBM2内存,可提供900 GB/s的最大理论带宽。 一个DGX-1节点有8个V100芯片,浮点计算性能高到离谱。

6f3b55ac312353d19d7a91e0bdaee3b3d6237008

现在,英伟达在DGX SaturnV系统里组装了660个DGX-1节点。660个!如果你把GPU从SaturnV中拿出来一个一个挨着放,差不多能排上一公里。

升级后的系统性能数字也十分可观:5280个Tesla V100 GPU,提供高达660个“AI”(FP16)petaFLOPS,80 petaFLOPS(FP32),以及40 petaFLOPS(FP64)。超大容量的半精度处理,至少部分来自于每个Volta GPU的672个张量处理核。

英伟达表示,计划将SaturnV用于超大规模单一任务关键型问题,同时解决对时间敏感的内部研究挑战。该公司表示,其GeForce产品团队将使用SaturnV来分析客户数据,以提供更优的游戏体验。SaturnV也已经用于英伟达自动驾驶项目,参与模拟了30万英里的驾驶数据。

c3d4890f2b07ea548f1010e0d8089cc520b622f5

英伟达还强调新集群的能效。升级后的DGX SaturnV集群,每瓦特功耗提供15 gigaFLOPS(FP64)计算能力。英伟达表示,其在开发系统方面的经验,包括调度和集群管理方面的创新,将为购买新集群的客户带来超值享受。

如果英伟达提供的理论数据能保持住,SaturnV的排名今后可能会比现在的名次(Top500第36名)还要高。完工之后,SaturnV可以轻松进入世界超算前十名,甚至有希望杀入前五。


原文发布时间为:2017-11-16

本文作者:文强

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【黄教主再放核弹】英伟达超级计算机SaturnV升级,有望杀入Top500榜单前五

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
9月前
|
人工智能 编解码 测试技术
云电脑显卡性能终极对决:ToDesk云电脑/顺网云/海马云,谁才是4K游戏之王?
本文对比了ToDesk云电脑、顺网云和海马云三大平台的性能表现,涵盖游戏实战与AI模型测试。ToDesk云电脑搭载RTX 5090显卡,在4K游戏与大模型支持上表现卓越;顺网云适合中轻度游戏玩家,强调即开即用的便捷性;海马云面向企业用户,提供稳定算力与多任务支持。评测从显卡、处理器、压力测试到网络传输技术全面展开,最终推荐:硬核玩家首选ToDesk云电脑,内容创作者可选ToDesk云电脑或海马云,企业用户则更适合海马云。
2087 23
|
自然语言处理 运维 Linux
阿里云操作系统智能助手OS Copilot测评报告及建议
阿里云推出的OS Copilot是一款基于大模型构建的操作系统智能助手,旨在通过自然语言处理技术与操作系统经验的深度融合,为Linux用户提供前所未有的使用体验。它具备自然语言问答、辅助命令执行和系统运维调优等核心功能,极大降低了Linux的学习门槛,提升了工作效率。测试显示,OS Copilot在功能、性能、易用性和实用性方面表现出色,能够帮助用户高效解决问题并优化系统性能。未来,期待其持续优化升级,加入更多实用功能,进一步提升用户体验。
409 4
|
消息中间件 NoSQL Java
Java必备面试题(100题)-八股篇
主要包括一些高频的Java面试的八股文面试题和答案
|
人工智能 自然语言处理 语音技术
使用AI识别语音和B站视频并通过GPT生成思维导图原创
AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。
1066 0
|
机器学习/深度学习 Ubuntu Shell
深度学习环境配置(Ubuntu+Anaconda)
深度学习环境配置(Ubuntu+Anaconda)
568 3
|
Kubernetes Go 网络架构
Golang热重载和优雅地关闭
Golang热重载和优雅地关闭
|
网络协议 数据安全/隐私保护 网络架构
如何在家中使用手机或电脑远程控制公司iStoreOS软路由下的电脑桌面
如何在家中使用手机或电脑远程控制公司iStoreOS软路由下的电脑桌面
793 4
|
SQL 缓存 Java
JDBC中PreparedStatement常用操作实践
JDBC中PreparedStatement常用操作实践
702 1
|
测试技术
Netty4 websocket 开启服务端并设置IP和端口号
Netty4 websocket 开启服务端并设置IP和端口号
560 0
|
存储 消息中间件 监控
消息中间件系列四、认识AMQP和RabbiyMq的简单使用
AMQP AMQP(advanced message queuing protocol)是一个提供统一消息服务的应用层标准协议,基于此协议的客户端与消息中间件可传递消息,并不受客户端/中间件不同产品,不同开发语言等条件的限制 。
3883 86