本文讲的是阿里云异构计算产品家族亮相 覆盖全场景AI和高性能计算需求,计算正推动着人工智能产业更大规模的爆发。9月12日,阿里云宣布推出全新一代异构加速平台,为人工智能产业提供多场景化的全球加速能力。这是阿里云异构计算家族首次亮相,涵盖GPU、FPGA在内等6款异构实例,可满足从图形渲染到高性能计算及人工智能等复杂应用的计算需求。特别是在人工智能领域,可将深度学习成本缩减一半,大幅降低人工智能计算门槛;而基于阿里云异构平台的全新高性能计算实例E-HPC,可一键部署获得媲美大型超算集群环境的“云上超算中心”。
这是继企业级ECS家族全线升级后,阿里云再次在企业级市场推出专业服务,将异构计算的使能领域从人工智能扩大到更广的计算需求领域。新品具备更强的并行能力和多场景支持,不仅全力支撑人工智能计算力升级需求,也为图形计算、生命科学、材料力学、分子动力学等科研计算领域提供普惠计算能力。
“人工智能浪潮催生的计算迭代需求远超摩尔定律,阿里云希望为人工智能产业提供最强的计算能力,我们开放了视频识别、语音识别、图像识别等人工智能服务及ET工业大脑、医疗大脑场景解决方案,今天我们推出的异构计算加速平台,将进一步完善人工智能产业生态,满足更多客户的核心业务需求。”阿里云异构计算负责人张献涛表示。
为深度学习而生 GPU实例GN5i降低人工智能成本50%
阿里云此次推出适用于深度学习在线推理(Inference)的GPU实例GN5i,采用了英伟达 Pascal架构P4图形处理器,提供最大45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力。可根据深度学习计算力的要求,进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配,分钟级即可完成实例的创建。下半年,阿里云还推出搭载目前性能最强GPU V100的高性能GPU实例,大幅提升深度学习的处理效率。
据阿里云高级技术专家龙欣介绍,在面向AI深度学习在线推理场景时,GN5i实例依托专有推理型GPU和阿里云高性能SSD云存储和OSS存储服务,在满足数据处理IO的基础上,时延最低可达微秒级;另外,GN5i可一键部署TensorFlow、Caffe等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务,有效降低人工智能在线服务成本50%以上。
全新FPGA实例F2 加快人工智能产业落地
作为异构计算近些年来的新宠,功耗低、实时性强的FPGA普遍被业界看好,提供云上基于FPGA的高效灵活场景化并行计算能力,已成为公共云的基础服务。阿里云2017年初推出了基于英特尔Arria 10芯片的FPGA计算实例,已帮助大量用户通过自定义加速算法,实现云上FPGA加速业务的一键部署、快速研发和弹性伸缩,有效提升了人工智能及深度学习的效率,为企业节省成本。
此次发布的F2实例基于赛灵思Xilinx KU115器件,提供145万逻辑门电路,单实例的单精度浮点计算性能可达1.5TFlops。随着集成英特尔(F1)和赛灵思(F2)芯片的FPGA计算实例相继面世,阿里云率先完成对主流FPGA方案的全覆盖,成为全球FPGA领域产品线最全、场景最多的公共云服务商。再加上阿里云业已推出的FPGA镜像市场,可帮助用户完成更多定制化FPGA加速方案,提高特定业务和算法的效率。
相比GPU和CPU,FPGA更适合非标数据位宽的人工智能、金融分析、基因匹配、物联网数据库等领域。龙欣介绍,阿里云针对非标准位宽场景做了大幅优化,以物联网时序数据库为例,F2的处理效率可比CPU高30倍,为用户大幅降低硬件加速时间和成本。“阿里云希望提供一个弹性、完善的FPGA开发环境,帮助用户缩短开发周期,并以最低的成本、最大的灵活度在云端快速搭建完整的硬件加速服务。“龙欣表示。
国内首家公共云HPCaaS产品E-HPC 超算界的“青藏高原”
而针对传统对高性能计算有强烈需求的高校科研机构和企业用户,阿里云异构计算家族则推出了弹性高性能计算实例E-HPC,这也是中国首个公共云上的HPC as a Service产品。E-HPC基于阿里云异构计算平台在高性能虚拟化、并行计算、低延迟网络和HPC软件栈等方面的特性,帮助生命科学,气象预报,石油勘探,工业设计和航空航天等领域的客户,快速获得高性能计算集群计算能力、调度能力和软件能力,按需组建自己的“云上超算中心”,并可实现一键部署和弹性伸缩。
“如果把传统超算中心比作‘珠穆朗玛峰’,那么阿里云的E-HPC则是将高性能计算做更普惠的覆盖,成为高性能计算的‘青藏高原’。” 阿里云资深专家何万青表示。
阿里巴巴集团内部很多业务通过异构计算取得非常好的计算加速效果,比如拍立淘、以图搜图、商品分类等,这些解决方案正通过阿里云对外输出;再加上阿里云基础设施在25G网络、第三代分布式存储、遍布全球的13个区域的数据中心及高可用骨干网等方面的不断创新,可为人工智能提供高性能、弹性伸缩和业务永续的加速引擎。
除了产品层面,阿里云还提供了全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云ET为客户服务。过去一年,阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统,将人工智能技术落地到产业中去。