【杭州云栖】异构计算:软硬件结合全栈助力AI大爆发

简介: 2018杭州云栖大会,异构计算专场精彩回顾

9月20日上午,杭州云栖小镇E1-2会场,备受业界关注的2018年杭州云栖大会异构计算专场召开。

近年来,人工智能持续爆发,对算力提出了更高的要求。异构计算作为大计算时代的解决方案,意在打破传统通用计算的限制,融合不同指令集和体系架构的计算单元,完美支持大计算场景。
___px_2018_09_21_1_

让每一个芯片都发挥最大效能

首先,阿里云弹性计算负责人,阿里云研究员余锋,带来了精彩的开场。余锋以摄影来打开话题:每一个镜头都会有特别的定位,在某个场景下合适但是另外场景会力不从心,异构计算的精髓也是如此,即让每一个芯片都发挥最大效能,扬长避短。

5A8A3433

余锋说:异构计算带来的计算效率提升是指数级的,但是需要有配套工具,基础设施等等。阿里云正在逐渐让这个门槛变低,并且和业内一起构建技术生态,让异构计算普惠行业,帮助合作伙伴和客户不断创新。

GN6实例 F3实例全面商业化

议题阶段,首先登场的是阿里云高级产品专家潘岳。潘岳首先介绍了正在全面商业化推进的GN6实例和F3实例。GN6实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例搭载Xilinx 16nm Virtex UltraScale+器件VU9P,对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。

5A8A3513

两大平台:昊天 和 舜天,全面助力企业创新

随后,潘岳首次揭秘了阿里云异构计算两大平台:昊天EGS平台和舜天FaaS平台;分别对应异构计算领域两大热门芯片方案:GPU和FPGA。潘岳指出,阿里云异构计算平台技术在阿里巴巴内部已经完成和多项业务的顺利融合,历经大范围高压测试,已然非常成熟。除此之外,异构计算全系产品与阿里云生态深度无缝融合,可以和传统的通用计算共用云上的全套服务。

_

在改善用户使用体验上,阿里云异构产品持续提供多种工具,来让异构产品更易用,这其中包括了方便开发部署的容器镜像工具,实时监测GPU状态的运维工具,以及神经网络框架优化的增值服务等。此后,潘岳分享了阿里云FPGA云服务器落地的业务场景。最后,在异构生态建设上,潘岳强调,阿里云积极引入国内外众多的解决方案供应商,共同构建完善异构生态体系,为企业客户提供高性能的加速解决方案。

昊天平台揭秘

论坛的第二个议题由阿里云资深技术专家龙欣带来,对昊天EGS平台进行了详细的剖析。龙欣指出阿里云异构计算的GPU云服务,在算力水平扩展趋势背景下,已经从GPU加速器的单点突破,向全面的平台体系演进。

5A8A3586

今天的演讲第一次披露了阿里云昊天EGS平台的服务体系:昊天平台在集群计算上,为不同规模的客户提供了从GPU集群运维监控,到底层CUDA驱动,再到中间框架加速层快速一键部署,和GPU集群分布式业务层定制化调优的全面专业服务。演讲还分享了昊天平台在底层基础设施层的技术架构:GPU虚拟机的热升级技术、与AMD联合开发的公共云首个基于SRIOV的GPU热迁移技术、神龙GPU技术与超级计算GPU集群技术。

成熟客户案例立体呈现

来自微博的资深技术专家黄波,从客户的角度,详细介绍了基于阿里云异构计算平台的深度学习案例。同时,黄波先生还从自身体验出发,总结了云端深度学习的优势:弹性,集群化管理,高性能,和专业服务等等。

5A8A3614

舜天平台揭秘

第四个登场的是阿里云资深技术专家张振祥,带来了对阿里云FaaS舜天平台的详细剖析。议题指出阿里云FaaS舜天平台是云上输出FPGA高性价比算力的使能器,大幅降低了FPGA的应用门槛。围绕着“易用性、稳定性、可扩展性和安全性”的设计理念,舜天平台做了大量的软硬件创新。

5A8A3669

张振祥强调,以舜天平台为依托,阿里云愿与业界的合作伙伴和客户并肩携手,打造FPGA异构计算的健康而强大的生态圈。随着云计算和人工智能的进一步普及,FPGA的器件和技术将获得进一步的提升和改善,更好地适用大算力的应用场景,服务更多的垂直市场。演讲过程中,现场反应热烈,业界同仁对共建生态圈体感强烈。

舜天平台助力阿里高性能时序数据库

最后,阿里巴巴技术专家钱赟介绍了基于阿里云舜天平台的高性能时序数据库。从实际案例出发,再次验证了舜天平台的性能极致,资源易用,IP安全,同时又可以大幅降低计算成本等特性。

5A8A3709

阿里云在异构计算上的逐步深入和成熟,正在帮助越来越多的企业在云上实现创新和突破。比如刚刚在MS COCO大赛获得4项世界冠军的旷视科技就是阿里云异构计算的深度用户。客户的成功一直是阿里云的诉求和共同目标,一起来用异构计算开启大计算时代吧。

相关阅读
【杭州云栖】弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石
AI技术出海 - 阿里云GPU服务器助力旷视勇夺4项世界第一
FPGA资源平民化的新晋- F3 技术解析
【FPGA-F3】阿里云FAAS平台,极大简化FPGA开发部署流程
扫盲人工智能的计算力基石--异构计算

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
10月前
|
存储 分布式计算 运维
【2023云栖】刘一鸣:Data+AI时代大数据平台建设的思考与发布
本文根据2023云栖大会演讲实录整理而成,演讲信息如下: 演讲人:刘一鸣 | 阿里云自研大数据产品负责人 演讲主题:Data+AI时代大数据平台应该如何建设
102029 14
|
3天前
|
人工智能 云栖大会 云计算
9.19-9.20 云栖工坊邀您亲手打造AI助手
9.19-9.20 云栖工坊邀您亲手打造AI助手
151 13
|
22天前
|
人工智能 Anolis
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
英特尔分论坛将依托英特尔云到端的全面产品组合,围绕至强可扩展处理器、AI 加速器、以及 oneAPI、OpenVINO 等软硬件技术展开探讨。
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
|
6天前
|
人工智能 Cloud Native Serverless
来云栖大会!探展云上开发,沉浸式体验云原生 + AI 新奇玩法
计算馆将展示中国最先进的云计算产业链全景,从底层硬件到数据创新,从云计算基础设施到数据管理服务、人工智能平台和模型服务,全景式呈现 AI 时代云计算最新技术形态和产品进展。计算馆有哪些推荐?往下看!
|
6天前
|
人工智能 Cloud Native 云栖大会
|
1月前
|
人工智能 前端开发 API
[AI Embedchain] 开始使用 - 全栈
[AI Embedchain] 开始使用 - 全栈
[AI Embedchain] 开始使用 - 全栈
|
1月前
|
人工智能 自然语言处理 API
云栖发布:通义听悟AI能力再进化,开放API接口
云栖发布:通义听悟AI能力再进化,开放API接口
|
1月前
|
人工智能
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
DataWhale AI夏令营 第四期魔搭- 大模型应用全栈开发task01笔记
61 0
|
3月前
|
人工智能 自然语言处理 API
云栖发布:通义听悟AI能力再进化,开放API接口
云栖发布:通义听悟AI能力再进化,开放API接口
|
10月前
|
人工智能 大数据 调度
【云栖2023】林伟:大数据AI一体化的解读
本文根据2023云栖大会阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人---林伟演讲实录整理而成,演讲主题:”大数据AI一体化的解读“。

热门文章

最新文章