为什么GTC大会上，Power的全新服务器备受推崇？-阿里云开发者社区

为什么GTC大会上，Power的全新服务器备受推崇？

2018-05-11 1106

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

不久前在北京举办的GTC China大会，是NVIDIA一年一度的GPU技术盛会。此次GTC再度回到北京，其火爆程度令人咋舌。而大会上发布的诸多新品，不仅令技术迷们高呼过瘾，而且再一次证明人工智能，深度学习，机器学习等正在加速改变未来的进程。其中最火的产品之一，就是IBM与NVIDIA合作的Power新服务器。

大会期间，NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生亲自介绍了采用Tesla P100GPU和NVLink的新款IBM Power SystemS822LC for High Performance Computing服务器，一度掀起了大会的高潮，而这一新品的问世，更是标志着双方携手进军高性能计算企业级市场的又一个里程碑。

认知计算和人工智能带来的机遇与挑战

数据显示，到2025年，包括认知计算在内的人工智能市场将达到360亿美元的规模，人工智能将成为IT 领域中发展最快的部分，或将引领继蒸汽机，电力，计算机之后的第四次工业革命。而各行各业的发展需要多种技术的共同作用。包括人工智能、自动驾驶汽车、实时欺诈预防、药物开发在内的不同领域都需要更高水平的计算能力。以往采用的计算方式和数据处理能力成为时代转型的巨大瓶颈和终极挑战。

正如在此次GTC大会上黄仁勋先生所深度阐释的那样，GPU计算产品与解决方案平台将拓展人工智能发展的想象空间，加速人工智能改变未来的进程。而深度学习作为全新的计算模型，正在改变计算的方方面面，不仅改变了软件开发的方式、开发地点和运行方法，还在改变着服务器架构、数据中心和智能设备。

以往采用的单纯CPU算法，完成一个相对复杂的深度学习训练模型即可能需要若干天或者几个月的时间，因此GPU加速成为了非常有效的辅助手段，使用GPU之后的深度学习的训练时间，可能会缩短90%，甚至更多。

如何把GPU的加速技术引入数据中心里面甚至云端，也正是IBM作为服务器领导者一直在考虑的问题。

IBM Power SystemS822LC for High Performance Computing 世界首款实现CPU与GPU，GPU之间互联的服务器

作为认知商业的倡导和推动者，IBM致力于不断通过技术创新助推时代的转型。在服务器系统领域，IBM 一直持续地进行技术研发，并同NVIDIA合作，加快新数据中心工作负载的处理速度。

经过四年的研发，IBM推出了面向高性能计算的IBM Power SystemS822LC for High Performance Computing，该服务器由 NVIDIA Tesla P100GPU 和 NVLink 提供支持，有助于进行高性能分析并对不断增加的数据实现深度学习。它是专门为人工智能、机器学习和高级分析应用场景而推出的。

IBM PowerSystem S822LC for High Performance Computing使用了两个 IBM POWER8 CPU 和四个NVIDIA Tesla P100GPU，并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器，其中 NVLink 接口集成在主板路由上，并且使用 NVIDIA 的 Tesla P100 SXM2 GPU。

此款服务器的最大亮点在于，它是世界上第一款支持NV Link互联，使得CPU与GPU，以及GPU之间都可以实现NVLink互联的一款服务器。GPU不再是作为CPU的一个协处理器，而是可以被看成一个统一的异构计算的总体，以实现性能的最大化。

NVLink是在Pascal最新一代GPU中的总线，其独有的高速互连技术，带宽可达80GB/S，相较于PCIe的32GB/S的速度，相当于将带宽提高了2.5倍，足以满足多芯片并行计算的需求。IBM POWER8是最早也是目前唯一支持这一标准的CPU。

而目前x86服务器是不支持NV Link互联的。当x86服务器搭载多个GPU时，只能使服务器的GPU之间使用NV Link，CPU与GPU之间的通信仍然需要使用PCIE的总线。在很多深度学习模型部署的案例中，存储带宽的限制是GPU计算的主要瓶颈。因此，实现NV Link互联的IBM Power SystemS822LC for High Performance Computing ，突破性地解决了这一问题，使得系统的智能大幅度提升。

带宽的优势在程序的应用过程中，更加至关重要。在模型部署中，计算量虽然没有训练过程中那么巨大，但是对带宽的要求非常高，这时NV Link就很有用武之地，因此在Power上做测试之后发现，相较于不支持NV Link互联的服务器会有非常大的性能提升。另外，NVIDIAPascal架构新支持的硬件内存分页机制与NVLink相结合，其巨大的内存带宽特别适合高效的训练复杂的深度学习模型。

“软”“硬 ”兼施，释放高性能爆发力

IBM致力于将认知商业分享到“云”端，不断满足来自各行业的客户的最新需求。

在软件方面，IBM通过SuperVessel，将Power以及OpenPOWER服务器开放出来，为客户提供服务，这也是首款在公有云上免费开放的GPU服务。SuperVessel是一款基于Openstack的全开源软件架构搭建的免费云平台。所有用户，只需要通过网站就可以申请虚拟机，或者体验各种服务、如GPU等加速器服务，认知计算服务，大数据服务等等。SuperVessel的用户遍布全球各地，其提供的很多应用，是基于Power8+GPU进行加速的。

本文出处：畅享网
本文来自云栖社区合作伙伴畅享网，了解相关信息可以关注vsharing.com网站。

为什么GTC大会上，Power的全新服务器备受推崇？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

为什么GTC大会上，Power的全新服务器备受推崇？

热门文章

最新文章

相关课程

相关电子书

相关实验场景