现在 90% 的 AI 设备都是基于 Arm 架构开发的,Arm 是一家英国芯片知识产权提供商,以 CPU 和 GPU 处理器而被熟知。为了提高机器学习的影响力,今天这家公司宣布了 Trillium 项目,包括一个机器学习处理器、一个目标检测处理器,和一个神经网络软件库的 Arm IP 套件。
Trillium 项目是这家公司在人工智能领域极富雄心的一次举措,通过集成设计提升 AI 设备的效率和性能,预计到 2028 年,这些设备的数量将从现在的 3 亿增长到 32 亿。
Arm 在机器学习领域的努力可以追溯到 2013 年,那时它开始探索 AI 市场并实施了一系列的战略收购。2017 年,这家公司宣布建立机器学习事业群,并任命 Jem Davies 担任总经理。在一次独家专访中,Davies 告诉 Synced 他认为「没有一个细分市场还没有或者不会被 AI 所冲击」。
「AI 几乎影响所有……手机、相机、智能音箱,甚至温度控制器。谁会想到房间温度控制器是一个智能装置呢?」Davies 说。
今天发布的机器学习芯片是 Arm 的第一代针对移动设备推断的 AI 芯片。该芯片使移动设备每平方毫米的运算性能不低于每秒 4.6 万亿次,在现实优化应用中实现 2 到 4 倍的吞吐量提升,以及在热度和能耗有限的环境里也能够实现超过 3 TOPs/W 的效率。
Davies 说其机器学习处理器背后的架构是全新的,根植于多年的研究成果。该架构为 16 位整数运算进行了优化。
新架构将为 CPU 和 GPU 遇到的挑战提供解决方案,Davies 说。「卷积神经网络非常普遍。重点是传统架构,不管是 CPU、GPU 还是 DSP,都要进行大量中间结果存储和加载。因此,我们生产了一种全新的架构,该架构使用智能存储系统。」
目标检测处理器是基于 Arm 现有的 IP 族 Spirit 的迭代。Spirit 是主导 Hive 安防摄像头的目标检测加速器,于 2016 年 Arm 收购 Apical 后不久发布,Apical 是一家为超过 15 亿设备提供计算机视觉和图像处理器的公司。
Arm 的第二代处理器可以全高清、60fps 实时检测无限数量的目标。其详细的人体模型提供了丰富的元数据,使方向、轨迹、姿势和动作检测成为可能。
Arm 提供集成解决方案,包括机器学习处理器和目标检测处理器。在实时目标识别任务中,目标检测处理器首先分离出感兴趣区域,比如人脸。这样,机器学习处理器就能够分析更少的像素,以实现更快、更精细的结果。
Arm 的组合解决方案。
Arm 的神经网络库是一系列图像、视觉和机器学习工作负载构造块的集合。开发者可使用该软件,以及 Arm 现有的实现工具,如加速算法和应用的 Compute Library,或最大化边缘设备上性能的 CMSIS-NN。该库支持主流框架,如 TensorFlow、Caffe,且已经为 Arm Cortex CPU、Mali GPU 和新型机器学习处理器进行了优化。
Arm 机器学习处理器将于今夏发售,目标检测处理器将于本季度末上市。