为什么GTC大会上,Power的全新服务器备受推崇?

简介:

不久前在北京举办的GTC China大会,是NVIDIA一年一度的GPU技术盛会。此次GTC再度回到北京,其火爆程度令人咋舌。而大会上发布的诸多新品,不仅令技术迷们高呼过瘾,而且再一次证明人工智能,深度学习,机器学习等正在加速改变未来的进程。其中最火的产品之一,就是IBMNVIDIA合作的Power新服务器。

大会期间,NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生亲自介绍了采用Tesla P100GPUNVLink的新款IBM Power SystemS822LC for High Performance Computing服务器,一度掀起了大会的高潮,而这一新品的问世,更是标志着双方携手进军高性能计算企业级市场的又一个里程碑。

认知计算和人工智能带来的机遇与挑战

数据显示,到2025年,包括认知计算在内的人工智能市场将达到360亿美元的规模,人工智能将成为IT 领域中发展最快的部分,或将引领继蒸汽机,电力,计算机之后的第四次工业革命。而各行各业的发展需要多种技术的共同作用。包括人工智能、自动驾驶汽车、实时欺诈预防、药物开发在内的不同领域都需要更高水平的计算能力。以往采用的计算方式和数据处理能力成为时代转型的巨大瓶颈和终极挑战。

正如在此次GTC大会上黄仁勋先生所深度阐释的那样,GPU计算产品与解决方案平台将拓展人工智能发展的想象空间,加速人工智能改变未来的进程。而深度学习作为全新的计算模型,正在改变计算的方方面面,不仅改变了软件开发的方式、开发地点和运行方法,还在改变着服务器架构、数据中心和智能设备。

以往采用的单纯CPU算法,完成一个相对复杂的深度学习训练模型即可能需要若干天或者几个月的时间,因此GPU加速成为了非常有效的辅助手段,使用GPU之后的深度学习的训练时间,可能会缩短90%,甚至更多。

如何把GPU的加速技术引入数据中心里面甚至云端,也正是IBM作为服务器领导者一直在考虑的问题。

IBM Power SystemS822LC for High Performance Computing 世界首款实现CPUGPUGPU之间互联的服务器

作为认知商业的倡导和推动者,IBM致力于不断通过技术创新助推时代的转型。在服务器系统领域,IBM 一直持续地进行技术研发,并同NVIDIA合作,加快新数据中心工作负载的处理速度。

经过四年的研发,IBM推出了面向高性能计算的IBM Power SystemS822LC for High Performance Computing,该服务器由 NVIDIA Tesla P100GPU  NVLink 提供支持,有助于进行高性能分析并对不断增加的数据实现深度学习。它是专门为人工智能、机器学习和高级分析应用场景而推出的。

IBM PowerSystem S822LC for High Performance Computing使用了两个 IBM POWER8 CPU 和四个NVIDIA Tesla P100GPU,并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器,其中 NVLink 接口集成在主板路由上,并且使用 NVIDIA  Tesla P100 SXM2 GPU

此款服务器的最大亮点在于,它是世界上第一款支持NV Link互联,使得CPUGPU,以及GPU之间都可以实现NVLink互联的一款服务器。GPU不再是作为CPU的一个协处理器,而是可以被看成一个统一的异构计算的总体,以实现性能的最大化。

NVLink是在Pascal最新一代GPU中的总线,其独有的高速互连技术,带宽可达80GB/S,相较于PCIe32GB/S的速度,相当于将带宽提高了2.5倍,足以满足多芯片并行计算的需求。IBM POWER8是最早也是目前唯一支持这一标准的CPU

而目前x86服务器是不支持NV Link互联的。当x86服务器搭载多个GPU时,只能使服务器的GPU之间使用NV LinkCPUGPU之间的通信仍然需要使用PCIE的总线。在很多深度学习模型部署的案例中,存储带宽的限制是GPU计算的主要瓶颈。因此,实现NV Link互联的IBM Power SystemS822LC for High Performance Computing ,突破性地解决了这一问题,使得系统的智能大幅度提升。

带宽的优势在程序的应用过程中,更加至关重要。在模型部署中,计算量虽然没有训练过程中那么巨大,但是对带宽的要求非常高,这时NV Link就很有用武之地,因此在Power上做测试之后发现,相较于不支持NV Link互联的服务器会有非常大的性能提升。另外,NVIDIAPascal架构新支持的硬件内存分页机制与NVLink相结合,其巨大的内存带宽特别适合高效的训练复杂的深度学习模型。

”“ 兼施,释放高性能爆发力

IBM致力于将认知商业分享到端,不断满足来自各行业的客户的最新需求。

在软件方面,IBM通过SuperVessel,将Power以及OpenPOWER服务器开放出来,为客户提供服务,这也是首款在公有云上免费开放的GPU服务。SuperVessel是一款基于Openstack的全开源软件架构搭建的免费云平台。所有用户,只需要通过网站就可以申请虚拟机,或者体验各种服务、如GPU等加速器服务,认知计算服务,大数据服务等等。SuperVessel的用户遍布全球各地,其提供的很多应用,是基于Power8+GPU进行加速的。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
7月前
|
人工智能 大数据 数据处理
云计算巨头大比拼:AWS、Azure和Google Cloud的终极对决
在云计算领域,AWS、Azure和Google Cloud三家巨头一直在竞相争夺市场份额。本文将从性能、可靠性、定价策略以及生态系统等方面对它们进行全面比较,帮助读者做出明智的选择。
1125 0
|
机器学习/深度学习 人工智能 边缘计算
AI芯片新星Wave Computing申请破产,曾对标英特尔ARM,却倒在黎明前夜
美国AI芯片初创公司,AI新星Wave Computing近日也宣布凉凉。这家AI计算领域备受关注的独角兽曾于2018年收购硅谷老牌名企MIPS,业界曾一度认为会对Intel ARM造成冲击。但因核心产品竞争力不足,屡次换帅加MIPS开源计划搁浅,最终遗憾收场。
332 0
AI芯片新星Wave Computing申请破产,曾对标英特尔ARM,却倒在黎明前夜
|
缓存 运维 安全
高端服务器市场重燃战火,国产K1 Power迎来第二春
高端服务器市场重燃战火,国产K1 Power迎来第二春
416 0
高端服务器市场重燃战火,国产K1 Power迎来第二春
|
机器学习/深度学习 人工智能 机器人
联想之星Comet Labs首次公开亮相:寻找和服务全球最好的人工智能创业公司
人工智能和机器人产业日益火爆,但如何真正的为业内创业公司解决问题,如何将人工智能技术与产业机会连接在一起,成为该行业亟待解决的问题
298 0
联想之星Comet Labs首次公开亮相:寻找和服务全球最好的人工智能创业公司
|
安全 API Swift
英特尔收购Hacker League(黑客马拉松平台)
大约两年前,Swift、Stanway和Jennings在大学寝室里搭建了Hacker League的原型——这一原型本身就是一次黑客马拉松的产物。自此以后,美国和世界上的黑客马拉松组织者利用Hacker League平台举办了450多次黑客马拉松活动。
182 0
英特尔收购Hacker League(黑客马拉松平台)
|
存储 Cloud Native 云计算
首届!「中国云计算基础架构开发者大会」征稿启动
首届中国云计算基础架构开发者大会(China Cloud Computing Infrastructure Developer Conference – 简称 CID)即将举行。 与 CLK (中国 Linux 内核开发者大会)不同的是,CLK 主题是与 Linux 内核相关,CID 主题则以云计算基础架构技术为主。本文推送首届 CID 的征稿启事,希望对云计算感兴趣的朋友们踊跃参与,一起办好首届峰会。
798 0
首届!「中国云计算基础架构开发者大会」征稿启动
|
机器学习/深度学习 NoSQL Linux
LC3大会,开源人的狂欢,反哺的力量驱动技术革新
在世界杯踢得正酣时,IT人也迎来了开源盛会LinuxCon + ContainerCon + CloudOpen中国(简称LC3)大会。从去年开始,LC3大会开始进入中国,正值开源云计算的这把火,在中国技术圈烧得越来越旺,同时也引发了越来越多国际同行的密切关注。
2193 0
|
机器学习/深度学习 人工智能 数据中心