【黄教主再放核弹】英伟达超级计算机SaturnV升级,有望杀入Top500榜单前五

简介: 最新一期国际超算权威榜单Top500发布,英伟达的DGX SaturnV 排名第36。就在昨天,英伟达宣布,使用最新的Volta升级该集群,一个DGX SaturnV里组装了660个DGX-1节点(每个节点8个V100芯片)。如果你把GPU从SaturnV中拿出来一个一个挨着放,差不多能排上一公里。

2017年超算大会,最新Top500榜单公布,但这里要说的不是中国的强力表现——虽然还是让我们简单回顾一下,中国上榜的超级计算机系统数量超越了美国(202 vs 143),神威·太湖之光和天河二号第四次蝉联冠亚军——而是英伟达。

ce69a9f03a8b58ea294f2089ce5acd727f086adb

最新的Top500超级计算机榜单中,英伟达的DGX SaturnV 系统排名第36。此外,榜单上有34个系统使用了他家的GPU。不仅如此,在全球Top20最高效的超级计算机集群中,有14个使用了英伟达的硬件。如果这还不够,该公司现在宣布,DGX SaturnV集群升级,使用最新的Tesla V100芯片。

单块Tesla V100芯片的规格令人印象深刻:有21亿个晶体管(1455 MHz),5120个流处理器,16 GB的封装HBM2内存,可提供900 GB/s的最大理论带宽。 一个DGX-1节点有8个V100芯片,浮点计算性能高到离谱。

6f3b55ac312353d19d7a91e0bdaee3b3d6237008

现在,英伟达在DGX SaturnV系统里组装了660个DGX-1节点。660个!如果你把GPU从SaturnV中拿出来一个一个挨着放,差不多能排上一公里。

升级后的系统性能数字也十分可观:5280个Tesla V100 GPU,提供高达660个“AI”(FP16)petaFLOPS,80 petaFLOPS(FP32),以及40 petaFLOPS(FP64)。超大容量的半精度处理,至少部分来自于每个Volta GPU的672个张量处理核。

英伟达表示,计划将SaturnV用于超大规模单一任务关键型问题,同时解决对时间敏感的内部研究挑战。该公司表示,其GeForce产品团队将使用SaturnV来分析客户数据,以提供更优的游戏体验。SaturnV也已经用于英伟达自动驾驶项目,参与模拟了30万英里的驾驶数据。

c3d4890f2b07ea548f1010e0d8089cc520b622f5

英伟达还强调新集群的能效。升级后的DGX SaturnV集群,每瓦特功耗提供15 gigaFLOPS(FP64)计算能力。英伟达表示,其在开发系统方面的经验,包括调度和集群管理方面的创新,将为购买新集群的客户带来超值享受。

如果英伟达提供的理论数据能保持住,SaturnV的排名今后可能会比现在的名次(Top500第36名)还要高。完工之后,SaturnV可以轻松进入世界超算前十名,甚至有希望杀入前五。


原文发布时间为:2017-11-16

本文作者:文强

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【黄教主再放核弹】英伟达超级计算机SaturnV升级,有望杀入Top500榜单前五

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
安全 数据处理 网络虚拟化
|
机器学习/深度学习 编解码 算法
yolov1到v8的变化
yolov1到v8的变化
482 1
|
11月前
|
人工智能 编解码 测试技术
云电脑显卡性能终极对决:ToDesk云电脑/顺网云/海马云,谁才是4K游戏之王?
本文对比了ToDesk云电脑、顺网云和海马云三大平台的性能表现,涵盖游戏实战与AI模型测试。ToDesk云电脑搭载RTX 5090显卡,在4K游戏与大模型支持上表现卓越;顺网云适合中轻度游戏玩家,强调即开即用的便捷性;海马云面向企业用户,提供稳定算力与多任务支持。评测从显卡、处理器、压力测试到网络传输技术全面展开,最终推荐:硬核玩家首选ToDesk云电脑,内容创作者可选ToDesk云电脑或海马云,企业用户则更适合海马云。
2363 23
|
SQL 算法 JavaScript
倒序排列的基本概念和应用场景
倒序排列的基本概念和应用场景
|
监控 测试技术 持续交付
掌握跨平台测试策略:确保应用的无缝体验
【10月更文挑战第14天】在多元化设备和操作系统的今天,跨平台测试策略成为确保应用质量和性能的关键。本文探讨了跨平台测试的重要性、核心优势及实施步骤,涵盖Web、移动和桌面应用的测试方法,帮助开发者提高应用的无缝体验。
|
消息中间件 NoSQL Java
Java必备面试题(100题)-八股篇
主要包括一些高频的Java面试的八股文面试题和答案
|
机器学习/深度学习 Ubuntu Shell
深度学习环境配置(Ubuntu+Anaconda)
深度学习环境配置(Ubuntu+Anaconda)
616 3
|
人工智能 自然语言处理 语音技术
使用AI识别语音和B站视频并通过GPT生成思维导图原创
AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。
1195 0
|
Kubernetes Go 网络架构
Golang热重载和优雅地关闭
Golang热重载和优雅地关闭