IBM 取得内存计算新突破，AI 训练能耗降低 80 倍-阿里云开发者社区

IBM 取得内存计算新突破，AI 训练能耗降低 80 倍

2018-04-23 1627

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： IBM Research 称，已经开发出了一种内存计算新方法，可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。该方法被称为“混合精度内存计算”，论文发表在 Nature Electronics 期刊。

IBM Research 称，已经开发出了一种内存计算新方法，可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。

在近日 Nature Electronics 期刊上发表的一篇论文中，IBM 研究人员描述了这种新的 “混合精度内存计算” 方法。

IBM 关注传统计算体系结构的不同看法，在这种体系结构中，软件需要在单独的 CPU 和 RAM 单元之间进行数据传输。

据 IBM 称，这种被称为 “冯·诺依曼” 的体系结构设计，为数据分析和机器学习应用制造了一个瓶颈，这些应用需要在处理单元和内存单元之间进行更大的数据传输。传输数据也是一个耗能的过程。

应对这一挑战，IBM 给出的一种方法是模拟相变内存（PCM）芯片，该芯片目前还处于原型阶段，500 万个纳米级 PCM 器件组成 500×2000 交叉阵列。

PCM 的一个关键优势是可以处理大多数密集型数据处理，而无需将数据传输到 CPU 或 GPU，这样以更低的能量开销实现更快速的处理。

IBM 的 PCM 单元将作为 CPU 加速器，就像微软用于加速 Bing 和加强机器学习的 FPGA 芯片一样。

据 IBM 称，研究表明在某些情况下，其 PCM 芯片能够以模拟的方式进行操作，执行计算任务，并提供与 4 位 FPGA 存储器芯片相当的准确度，但能耗降低了 80 倍。

模拟 PCM 硬件并不适合高精度计算。所幸的是，数字型 CPU 和 GPU 是适合的，IBM 认为混合架构可以实现更高性能、更高效率和更高精度的平衡。

这种设计将大部分处理留给内存，然后将较轻的负载交给 CPU 进行一系列的精度修正。

根据 IBM 苏黎世实验室的电气工程师、也是该论文的主要作者 Manuel Le Gallo 称，这种设计有助于云中的认知计算，有助于释放对高性能计算机的访问。

Le Gallo 表示：“凭借我们现在的精确度，我们可以将能耗降低到是使用高精度 GPU 和 CPU 的 1/6。”

“所以我们的想法是，为了应对模拟计算中的不精确性，我们将其与标准处理器结合起来。我们要做的是将大量计算任务转移到 PCM 中，但同时得到最终的结果是精确的。”

这种技术更适合于如数字图像识别等应用，其中误解少数像素并不会妨碍整体识别，此外还有一些医疗应用。

“你可以用低精度完成大量计算——以模拟的方式，PCM 会非常节能——然后使用传统处理器来提高精度。”

对于只有 1 兆字节大小的 IBM 原型内存芯片，现在还处于初期阶段。为了适用于现代数据中心的规模化应用，它需要达到千兆字节的内存量级，分布在数万亿个 PCM 中。

尽管如此，IBM 认为可以通过构建更大规模的 PCM 设备或使其中 PCM 并行运行来实现这一目标。

原文发布时间为：2018-04-21

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”。

原文链接：IBM 取得内存计算新突破，AI 训练能耗降低 80 倍

IBM 取得内存计算新突破，AI 训练能耗降低 80 倍

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

IBM 取得内存计算新突破，AI 训练能耗降低 80 倍

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景