为主流价位移动设备加入AI计算:ARM发布新一代Mali解决方案

简介: 随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。

3 月 6 日下午,移动设备芯片设计公司 Arm 在北京举行了产品发布会,向全球发布了其人工智能计算的最新解决方案,其中包括 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器。


e928e246d911f4120bdc5c5669e2755a.jpg



随着人工智能技术的逐渐实用化,人们对于机器学习算力的需求正在飞速增长,除英特尔、英伟达等传统芯片厂商以外,谷歌、亚马逊等公司都在致力于打造自己的专用 AI 处理器。为了保持在移动芯片领域的领先地位,Arm 也在沿着自己的道路不断推进。2 月 14 日,该公司宣布启动 Trillium 项目,其中包括未来的专用机器学习处理器、目标检测处理器,以及神经网络软件库的 Arm IP 套件。而昨天在北京发布的新一代硬件产品则宣示了 Arm 在主流市场上已开始了自己的行动。


「目前在移动的世界里,消费者的使用行为已经发生了变化,」Arm 计算事业群市场营销资深总监 Ian Smythe 说道。「今天,手机是人通向世界的大门,Arm 作为一家企业的使命是让技术以无形的方式来让人连接世界。」


在 Arm 看来,今天移动端设备消费者行为的变化带来了三大新需求:机器学习应用、3D 视频游戏、和虚拟/增强现实。


这或许意味着未来芯片市场的格局会出现翻天覆地的变化。据估算,至 2018 年底,中国将设计和制造超过 10 亿台智能手机并销往世界,中国厂商在海外市场的份额正在以每年翻倍的速度快速增长。这样的速度使得 Arm 分外重视中国市场,该公司正在积极寻求与国内厂商在新架构上的合作。


目前,Arm 对于自己在市场上的领先地位感到满意。「目前市场上大部分移动技术都是基于 Arm 的,」Ian Smythe 介绍道,「其中包括 Cortex-A 的处理器——世界上绝大部分的智能手机都装载了 Cortex-A 系列处理器。同时 Arm 拥有一个多媒体方面的品牌 Mali,它也是全球 GPU 出货量最大的 GPU。简而言之,Arm 在全球的合作伙伴去年共计出货基于 Mali 的片上系统(SoC)达到了 12 亿片。」


e62abfb542b117f9fa5cbe73151d91c1.jpg


AI 和机器学习是现在最热门的话题,而作为被用到最多的计算设备,手机等移动设备则是机器学习的重要应用场景。很多用户已经在不知情的情况下享受到了机器学习带来的便利。事实上,在搜索、机器翻译和照相等应用的背后都有机器学习的身影。


作为最大的移动端芯片设计者,Arm 的产品是机器学习计算的重要承载设备。根据 IDC 统计,目前市场上 90% 的 AI 计算由 Arm 来实现的。


与华为、苹果推出的深度学习芯片相对应,Arm 在 2017 年推出了 DynamIQ 异构计算解决方案。DynamIQ 完全改变了 Cortex 系列处理器的部署方式,它为 CPU 引入了一系列全新指令集,极大提升了人工智能计算的性能。同时它也极大地提高了多核计算的灵活性,在 8 核处理器系统中(1 大核加 7 小核),DynamIQ 实现了在同样的硅面积之下,总体线程性能翻一番,与此同时,它也能实现高性能的双四核布局。


在发布会上,Arm 发布了全新的 Mali-G52、G31 移动端显卡,Mali-D51 显示处理器以及 Mali-V52 视频处理器设计。据介绍,新一代芯片设计在机器学习计算性能上有了大幅提升,适用于主流市场上的手机、智能电视等设备。


Mali G52 GPU 的上一代 G51 是正好在一年以前发布的,时隔一年,新一代的产品就已获得了性能密度 30% 的提升,性能效率比 15% 提升,而在机器学习能力上,新一代设计更是获得了 3.6 倍的性能提升。


62d053d31eb21c8541c0b85df9cc9cf0.jpg


Mali-G52 采用典型的四核布局。其执行引擎由 G51 中的四线程扩展到了八线程。因此在复杂的指令上,它能够实现两倍的性能,因此在芯片面积上 G52 是 G51 的 1.2 倍,但性能上前者却是后者的两倍。为了更好地支持机器学习,Arm 也加入了一些具体的指令,其中包含英特尔一直以来支持的一些指令,在 ImageNet 图像分类与 Yolo network 卷积层性能测试中,G52 的性能相对前代产品都有了非常大的提升。


87ec2ccc51f533f014091173be8460ae.jpg

在显示芯片上,Arm 配套推出了 Mali D51,它是去年 DP650 的继承者。相较前代产品性能密度提升了一倍,通过使用 Offload 技术,它的性能效率则有 30% 的提升,同时内存时延减少了 50%。


通过把 Mali-D51 和 Assertive Display5、HDR10 结合在一起。Arm 的解决方案可以让目前主流价位设备的显示屏都能实现 HDR4K 画质,从而进一步提升产品的竞争力。


0e05cf62c2e7657eab9e23e2bd2276ec.jpg

Mali-V52 则是基于 Arm 多核 Video 的视频输出解决方案。与前代产品 Mali-V61 相比较,其在解码性能方面有了一倍提升,硅晶片面积降低了近 40%,同时在视频的质量上提升了 20%。针对于一些特定的使用场景,Arm 能够提供优化解决方案。如在智能电视应用上,基于 Mali-V52 的设备可以在一个电视显示屏上同步展示多达 16 个视频流。


1743586cb335f39597a1f0108b02274b.jpg

与此同时,Arm 还推出了面向低端市场的新一代 GPU Mail-G31,它也是 G30 系列,Bifrost 架构家族中的第一款 GPU。它和 Mali-G51 采用的架构技术是一样的,但总硅面积降低了 20%,在性能密度上也有 20% 的提高,同时在 UI 性能方面有 12% 的提升。


95901ce3abc7af5454f2bbb4e70dc37b.jpg


至此,Arm 的下一代中/低端视频处理芯片解决方案的组件已全部推出,这家公司正在积极推进新设计的产品落地。Ian Smythe 表示,目前已经有很多合作伙伴正在开发基于 Mali V52、D51 的产品。在 GPU 方面,预计在今年晚些时候我们就将在市场上看到搭载 Mali G31 芯片的设备面世,而搭载 G52 的设备则可能会于 2019 年出现在市场上。


a24ef5f6eb359891cb7c6404ab07b4c9.jpg


相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
7天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
46 2
|
17天前
|
数据采集 人工智能 监控
体验《AI大模型助力客户对话分析》解决方案测评
该方案详细描述了实现AI客服对话分析的实践原理和实施方法,包括数据收集、模型训练、部署及评估等步骤,逻辑清晰。但在OSS配置和模型选择等方面存在一些困惑,需进一步引导。示例代码大部分可直接应用,但特定环境下需调整。总体而言,方案基本能满足实际业务需求,但在处理复杂对话时需进一步优化。
45 6
|
21天前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。
|
23天前
|
数据采集 机器学习/深度学习 人工智能
《AI大模型助力客户对话分析》解决方案测评
本文对《AI大模型助力客户对话分析》解决方案进行了测评,详细介绍了实践原理和实施方法的清晰度、部署过程中的困惑、示例代码的适用性和异常处理以及业务场景的适用性和改进建议。方案整体实用性强,但在数据预处理、术语解释和行业特定模型训练方面有进一步提升的空间。
|
13天前
|
存储 人工智能 弹性计算
基于《文档智能 & RAG让AI大模型更懂业务》解决方案实践体验后的想法
通过实践《文档智能 & RAG让AI大模型更懂业务》实验,掌握了构建强大LLM知识库的方法,处理企业级文档问答需求。部署文档和引导充分,但需增加资源选型指导。文档智能与RAG结合提升了文档利用效率,但在答案质量和内容精确度上有提升空间。解决方案适用于法律文档查阅、技术支持等场景,但需加强数据安全和隐私保护。建议增加基于容量需求的资源配置指导。
67 4
|
15天前
|
人工智能 弹性计算 监控
触手可及,函数计算玩转 AI 大模型解决方案
阿里云推出的“触手可及,函数计算玩转 AI 大模型”解决方案,利用无服务器架构,实现AI大模型的高效部署和弹性伸缩。本文从实践原理、部署体验、优势展现及应用场景等方面全面评估该方案,指出其在快速部署、成本优化和运维简化方面的显著优势,同时也提出在性能监控、资源管理和安全性等方面的改进建议。
45 5
|
15天前
|
人工智能 数据安全/隐私保护 UED
RAG让AI大模型更懂业务解决方案部署使用体验
根据指导文档,部署过程得到了详细步骤说明的支持,包括环境配置、依赖安装及代码示例,确保了部署顺利进行。建议优化知识库问题汇总,增加部署失败案例参考,以提升用户体验。整体解决方案阅读与部署体验良好,有助于大型语言模型在特定业务场景的应用,未来可加强行业适应性和用户隐私保护。
55 5
|
12天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
31 1
|
12天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,大模型在各领域的应用日益广泛。然而,将其私有化部署到企业内部面临诸多挑战,如硬件资源需求高、数据隐私保护、模型可解释性差、更新维护成本高等。本文探讨了这些挑战,并提出了优化硬件配置、数据加密、可视化工具、自动化更新机制等解决方案,帮助企业顺利实现大模型的私有化部署。
34 1
|
13天前
|
人工智能 边缘计算 监控
边缘AI计算技术应用-实训解决方案
《边缘AI计算技术应用-实训解决方案》提供完整的实训体系,面向高校和科研机构的AI人才培养需求。方案包括云原生AI平台、百度AIBOX边缘计算硬件,以及8门计算机视觉实训课程与2门大模型课程。AI平台支持大规模分布式训练、超参数搜索、标注及自动化数据管理等功能,显著提升AI训练与推理效率。硬件涵盖多规格AIBOX服务器,支持多种推理算法及灵活部署。课程涵盖从计算机视觉基础到大模型微调的完整路径,通过真实商业项目实操,帮助学员掌握前沿AI技术和产业应用。
37 2