最新MLPerf基准测试:基于阿里云GPU云服务器的AIACC在图像识别封闭式场景下夺冠

简介: 最低延时0.38毫秒

图片0.png

近日,全球权威AI基准评测组织MLCommons公布了最新一期 MLPerf™ v2.1推理性能基准测试结果。阿里云在Edge封闭式、数据中心和Edge开放式、数据中心网络等场景均表现亮眼。其中,基于阿里云弹性计算GPU云服务器的神龙AI加速引擎(AIACC)在图像识别的Edge封闭式场景中实现了最低延时,突破性能天花板,处于业界第一


MLPerf Benchmark是一套用于测量机器学习软硬件性能的通用基准,由来自学术界、研究实验室和相关行业的 AI 领导者组成的联盟,旨在“构建公平和有用的基准测试”;评估在不同条件下,不同企业硬件、软件和服务的训练和推理性能;可以帮助企业简化选择AI软硬件服务的流程。


MLPerf覆盖了图像分类、目标检测、医学图像分割、自然语言处理等不同的AI服务场景,阿里云AIACC本次参与的主要是图像识别的封闭式推理场景。


封闭式即指在不对模型进行任何改动,仅优化底层软硬件平台的情况下获得的性能,具有极大优化难度。往期的封闭式场景结果中,搭载最新的NVIDIA TensorRT版本是所有NVIDIA GPU硬件平台的性能天花板,不同厂商的差距仅在于不同GPU硬件产生的小幅性能差异。本次MLPerf™ v2.1推理结果的Edge封闭式计算中,神龙AI加速引擎(AIACC)针对ResNet50的单流(单任务处理)推理进行了专门的深入优化,超过了直接使用NVIDIA TensorRT的用例,获得了0.38毫秒的最低延时,意味着在阿里云上识别一张图片只需要0.38毫秒。

图片1.1png.png

MLPerf Inference Edge v2.1截图


阿里云神龙加速引擎AIACC团队本次主要基于两款阿里云GPU云服务实例——gn7i、gn7e实例。


在gn7i实例上,AIACC实现了单流时延0.40 毫秒,低于业界其他厂商0.44-0.50毫秒的时延;在gn7e实例上,AIACC加速的ResNet50推理时延为仅为0.38毫秒,远低于其他厂商0.50-0.53毫秒的延时。

图片2.png

图片3.png


阿里云GPU云服务器是提供 GPU 算力的弹性计算服务,具有超强的计算能力,服务于深度学习、科学计算、图形可视化、视频处理多种应用场景,能为客户提供软件与硬件结合的完整服务体系,助力客户在实际业务中实现资源的灵活分配、弹性扩展、算力的提升以及成本的控制。


基于阿里云弹性计算服务ECS的神龙计算加速引擎致力于为阿里云ECS客户提供快速、便捷、用户无感的计算加速服务,覆盖AI训练与推理、大数据、通用计算等领域。在AI训练与推理领域,神龙AI加速引擎(AIACC)持续深耕性能优化技术,服务了大量客户优化AI计算业务性能,助力其业务在阿里云GPU云服务器上线部署和提速,并曾在世界AI性能权威榜单DAWNBench中斩获4项世界第一。在大数据领域,神龙大数据加速引擎(MRACC)亦在世界大数据权威榜单TPC Benchmark Express-BigBench(TPCx-BB) SF3000摘得桂冠。


AIACC和MRACC等性能优化技术在长期服务客户的过程中得以积累和沉淀,客户可在阿里云GPU云服务实例和阿里云弹性计算ECS实例上开放使用,应用无感的提升客户业务的性能。


点击这里,了解阿里云GPU云服务器。



丨近期活动预告

面对“元宇宙”概念兴起,我们邀请到NVIDIA中国Omniverse业务负责人何展、沙核科技创始人楼彦昕、阿里云弹性计算产品专家张新涛,分享行业理解、落地案例、瓶颈挑战等。数字世界先锋x科技艺术家x云计算活化石,欢迎看三位碰撞出何种观点。


本次对谈节目,将于9月26日下午2点播出,点击这里预约直播


活动海报_1080_1920.jpg


相关文章
|
22天前
|
弹性计算 数据挖掘 应用服务中间件
阿里云轻量应用服务器68元与云服务器99元和199元区别及选择参考
目前阿里云有三款特惠云服务器,第一款轻量云服务器2核2G68元一年,第二款经济型云服务器2核2G3M带宽99元1年,第三款通用算力型2核4G5M带宽199元一年。有的新手用户并不是很清楚他们之间的区别,因此不知道如何选择。本文来介绍一下它们之间的区别以及选择参考。
329 87
|
15天前
|
存储 弹性计算 应用服务中间件
阿里云轻量应用服务器出新品通用型实例了,全球26个地域可选
近日,阿里云再度发力,推出了首款全新升级的轻量应用服务器——通用型实例。这款服务器实例不仅标配了200Mbps峰值公网带宽,更在计算、存储、网络等基础资源上进行了全面优化,旨在为中小企业和开发者提供更加轻量、易用、普惠的云计算服务,满足其对于通用计算小算力的迫切需求。目前,这款新品已在全球26个地域正式上线,为全球用户提供了更加便捷、高效的上云选择。
115 27
|
6天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
50 11
|
6天前
|
存储 弹性计算 数据挖掘
阿里云服务器ECS通用算力型u1和ECS经济型e实例性能特点、使用及常见问题解答FAQ
阿里云ECS云服务器的经济型e实例和通用算力型u1实例深受开发者和中小企业青睐。e实例适合中小型网站、开发测试等轻量级应用,采用共享CPU调度模式,性价比高;u1实例则适用于中小型企业级应用,提供更高的性能保障和稳定性,支持固定CPU调度模式,计算性能更稳定。同等配置下,u1实例在网络带宽、IOPS等方面表现更优,价格也相对较高。个人用户可选择e实例,中小企业建议选择u1实例以确保业务稳定性。
|
2月前
|
机器学习/深度学习 人工智能 PyTorch
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
阿里云GPU云服务器怎么样?阿里云GPU结合了GPU计算力与CPU计算力,主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景,本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。
阿里云GPU云服务器怎么样?产品优势、应用场景介绍与最新活动价格参考
|
1月前
|
存储 运维 安全
阿里云弹性裸金属服务器是什么?产品规格及适用场景介绍
阿里云服务器ECS包括众多产品,其中弹性裸金属服务器(ECS Bare Metal Server)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点。分钟级的交付周期将提供给您实时的业务响应能力,助力您的核心业务飞速成长。本文为大家详细介绍弹性裸金属服务器的特点、优势以及与云服务器的对比等内容。
119 23
|
15天前
|
存储 Serverless 文件存储
AI 场景下,函数计算 GPU 实例模型存储最佳实践
当前,函数计算 FC 已被广泛应用在各种 AI 场景下,函数计算支持通过使用容器镜像部署 AI 推理应用,并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用,并快速解决不同场景下的模型存储选型问题,本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析,以期为您的模型存储决策提供帮助。
|
2月前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
23天前
|
存储 人工智能 网络协议
浅聊阿里云倚天云服务器:c8y、g8y、r8y实例性能详解与活动价格参考
选择一款高性能、高性价比的云服务器对于企业而言至关重要,阿里云推出的倚天云服务器——c8y、g8y、r8y三款实例,它们基于ARM架构,采用阿里自研的倚天710处理器,并基于新一代CIPU架构,通过芯片快速路径加速手段,实现了计算、存储、网络性能的大幅提升。2025年,计算型c8y云服务器活动价格860.65元一年起,通用型g8y云服务器活动价格1187.40元一年起,内存型r8y云服务器活动价格1454.32元一年起。本文将为大家详细解析这三款实例的性能特点、应用场景以及最新的活动价格情况,帮助大家更好地了解阿里云倚天云服务器。
|
16天前
|
人工智能 安全 Linux
阿里云与龙蜥携手打造智算时代最佳服务器操作系统
本次分享的主题是阿里云与龙蜥携手打造智算时代最佳服务器操作系统,由阿里云技术软件部产品总监张鹏程分享。主要分为三个部分: 1.开源社区 2.操作系统 3.云 + AI
阿里云与龙蜥携手打造智算时代最佳服务器操作系统

相关产品

  • 云服务器 ECS
  • GPU云服务器