权威 AI 测试 MLPerf 公布最新榜单:阿里巴巴拿下多项算力第一

简介: 4 月 7 日,权威 AI 基准评测组织 MLPerf 公布了最新一期推理性能榜单。MLPerf 由图灵奖得主 David Patterson 于 2018 年发起,每年组织全球 AI 训练和 AI 推理性能测试并发榜,已成为业界最主流标准之一。

4 月 7 日,权威 AI 基准评测组织 MLPerf 公布了最新一期推理性能榜单。MLPerf 由图灵奖得主 David Patterson 于 2018 年发起,每年组织全球 AI 训练和 AI 推理性能测试并发榜,已成为业界最主流标准之一。

image.png

北京时间 4 月 7 日,MLCommons 发布最新 MLPerf 榜单

本次榜单重点更新了面向数据中心和边缘计算的场景,以及最新的 MLPerf Tiny 0.7 测试榜单。阿里云联合平头哥、达摩院等在数据中心、边缘计算、物联网领域斩获多项第一。

image.png

在当前激烈的数据中心和边缘计算场景下,各厂商及机构基于硬件加速的成绩差距并不大,竞争主要聚焦在模型软硬协同优化方面。榜单显示,阿里云磐久服务器脱成为 MLPerf 有史以来首个获得纯 CPU 推理性能最高的 ARM 架构服务器,且在数据中心和边缘侧该类别的总体性能均为第一。

image.png

MLPerf 2.0 DatacenterCPU-Only 推理性能数据对比

据悉,阿里云震旦异构加速平台利用模型优化工具 SinianML 来进行用于 AI 任务的神经网络架构搜索和压缩,以及最佳算子实现。在保证达到基准测试精度目标同时,能得到远高于标准 ResNet50 v1.5 的计算效率。

此外,在 MLPerf Tiny 场景,阿里云通过大规模深度算子融合和针对平头哥玄铁 RISC-V 微架构的极致优化,从而能够大大提高 CPU 算力利用率,实现软硬协同优化。

Tiny 场景是 MLPerf 近年新增的性能测试分类。有别于 Datacenter 等大规模、高算力的情景,Tiny 聚焦于低功耗、高性价比的 IoT 场景,考验在日益广泛的 IoT 智能应用场景下的软硬件性能和优化能力。

在此次公布的 MLPerf Tiny 0.7 性能数据榜单中,阿里云震旦异构计算加速平台通过编译和软硬件一体化创新优化,结合达摩院在语音和视觉等机器智能的算法知识,基于平头哥自研 RISC-V 玄铁 C906 处理器在所有 4 项 Benchmark 的 CPU 性能数据均取得第一,在满足模型精度要求的同时创造了 RISC-V 架构在该 AI 基准测试榜单上的最好成绩。

image.png

MLPerf Tiny 0.7 推理性能数据对比

“高度集成的专业化 AI 芯片对应用场景限制很多,我们希望研发出更通用的软硬协同加速平台来发挥 AI 应用的价值,”阿里云异构计算首席科学家张伟丰博士表示。

了解更多软件开发与相关领域知识,点击访问 InfoQ 官网:https://www.infoq.cn/,获取更多精彩内容!

不难发现,MLPerf 正将评测环境更多地向云厂商倾斜,后者已成为 AI 产业的主力军。

目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI在软件测试中的转型力量###
本文深入探讨了人工智能(AI)技术在软件测试领域的应用现状与未来趋势,通过分析AI如何优化测试流程、提高测试效率与质量,揭示了AI赋能下软件测试行业的转型路径。传统测试方法面临效率低、成本高、覆盖率有限等挑战,而AI技术的引入正逐步改变这一格局,为软件测试带来革命性的变化。 ###
|
24天前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
206 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
23天前
|
人工智能
国家电网与阿里巴巴达成AI合作!
国家电网与阿里巴巴达成AI合作!
67 17
|
1月前
|
存储 人工智能 安全
AI时代,存力 or 算力 哪个更重要
本文探讨了AI技术发展中算力与存力的重要性。算力指计算能力,对处理大数据和实时计算至关重要;存力则是数据存储能力,确保数据安全可靠,支持后续分析。两者相辅相成,共同推动AI技术的快速发展,缺一不可。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
智能化软件测试:AI驱动的自动化测试策略与实践####
本文深入探讨了人工智能(AI)在软件测试领域的创新应用,通过分析AI技术如何优化测试流程、提升测试效率及质量,阐述了智能化软件测试的核心价值。文章首先概述了传统软件测试面临的挑战,随后详细介绍了AI驱动的自动化测试工具与框架,包括自然语言处理(NLP)、机器学习(ML)算法在缺陷预测、测试用例生成及自动化回归测试中的应用实例。最后,文章展望了智能化软件测试的未来发展趋势,强调了持续学习与适应能力对于保持测试策略有效性的重要性。 ####
|
2月前
|
人工智能 供应链 安全
AI辅助安全测试案例某电商-供应链平台平台安全漏洞
【11月更文挑战第13天】该案例介绍了一家电商供应链平台如何利用AI技术进行全面的安全测试,包括网络、应用和数据安全层面,发现了多个潜在漏洞,并采取了有效的修复措施,提升了平台的整体安全性。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
自动化测试的新篇章:利用AI提升软件质量
【10月更文挑战第35天】在软件开发的海洋中,自动化测试犹如一艘救生艇,它帮助团队确保产品质量,同时减少人为错误。本文将探索如何通过集成人工智能(AI)技术,使自动化测试更加智能化,从而提升软件测试的效率和准确性。我们将从AI在测试用例生成、测试执行和结果分析中的应用出发,深入讨论AI如何重塑软件测试领域,并配以实际代码示例来说明这些概念。
88 3
|
2月前
|
人工智能 测试技术 Windows
Windows 竞技场:面向下一代AI Agent的测试集
【10月更文挑战第25天】随着人工智能的发展,大型语言模型(LLMs)在多模态任务中展现出巨大潜力。为解决传统基准测试的局限性,研究人员提出了Windows Agent Arena,一个在真实Windows操作系统中评估AI代理性能的通用环境。该环境包含150多个多样化任务,支持快速并行化评估。研究团队还推出了多模态代理Navi,在Windows领域测试中成功率达到19.5%。尽管存在局限性,Windows Agent Arena仍为AI代理的评估和研究提供了新机遇。
59 3
|
2月前
|
机器学习/深度学习 人工智能 安全
探索AI在软件工程中的最新应用:自动化测试与代码审查
探索AI在软件工程中的最新应用:自动化测试与代码审查
|
2月前
|
机器学习/深度学习 数据采集 人工智能
探索AI驱动的自动化测试新纪元###
本文旨在探讨人工智能如何革新软件测试领域,通过AI技术提升测试效率、精准度和覆盖范围。在智能算法的支持下,自动化测试不再局限于简单的脚本回放,而是能够模拟复杂场景、预测潜在缺陷,并实现自我学习与优化。我们正步入一个测试更加主动、灵活且高效的新时代,本文将深入剖析这一变革的核心驱动力及其对未来软件开发的影响。 ###

热门文章

最新文章