更节能,基于忆阻器的贝叶斯机器

简介: 更节能,基于忆阻器的贝叶斯机器


在过去的几十年里,机器学习模型在各种现实世界任务上的性能有了显着提高。然而,训练和实施这些模型中的大多数仍然需要大量的能量和计算能力。

忆阻器和其他新兴存储技术,可用于创建神经网络的节能实现。然而,对于某些边缘应用,神经网络可能无法提供可接受的智能形式。贝叶斯推理可以解决这些问题,但它的计算成本很高,而且与神经网络不同,它不会自然地转化为基于忆阻器的架构。

近日,来自法国巴黎萨克雷大学、格勒诺布尔-阿尔卑斯大学、HawAI.tech、索邦大学和艾克斯-马赛大学的研究人员创建了一种所谓的贝叶斯机器(即,一种基于贝叶斯定理执行计算的人工智能方法)。比目前使用的硬件解决方案更节能。

机器的架构是通过编写贝叶斯定律来获得的,这种方法使它的实现通过分布式内存和随机计算的原理变得自然,允许电路仅使用本地内存和最少的数据移动来运行。

该研究以「A memristor-based Bayesian machine」为题,发布在《Nature Electronics》上。


论文链接:https://www.nature.com/articles/s41928-022-00886-9

智能边缘系统可用于监测人体健康、建筑物安全、工业设施和环境。然而,可以提供此类服务的人工智能 (AI) 算法在传统硬件上运行时会消耗大量能量。因此,大多数边缘系统将其感知数据上传到云端进行处理,这会产生隐私和安全问题。

对于智能医疗传感器等应用,神经网络有一些重要的局限性。首先,他们需要接受大量数据的训练,而这些数据通常不可用。其次,他们的结果是无法解释的,由于道德和监管原因,这对于某些关键应用来说是不可接受的。贝叶斯推理是一种可以更好地适应这些情况的人工智能方法。

贝叶斯推理是一种概率框架,允许在信息不完整的情况下做出决策,最大限度地结合所有可用的证据、假设和先验知识。在这种方法中,推理是完全可解释的,并且在「小数据」情况下表现出色,因为它能够结合先前的专家知识。它还可以估计其预测的确定性,这对神经网络来说是一个挑战。贝叶斯模型并非直接受到大脑启发,而是与生物智能相关联。

然而,尽管贝叶斯推理需要大量的内存访问,但将其用于近内存计算比神经网络更具挑战性。

忆阻器本质上是基于纳米设备的电子元件,可以限制或调节电路中的电流,同时还可以预先记录其中传递的能量。由于它们同时执行计算和信息存储,这些设备可以更好地再现人脑的信息处理策略。

在此,研究人员提出了一个可以在硬件中完全实现的基于忆阻器的贝叶斯系统。他们制造了一个原型电路,它使用混合互补金属氧化物半导体(CMOS)/忆阻器工艺在同一芯片上集成了 2,048 个忆阻器和 30,080 个晶体管。

图示:贝叶斯机器的一般架构。(来源:论文)

为了验证基于忆阻器的贝叶斯推理的可行性,在混合 CMOS/电阻式随机存取存储器工艺中制作了原型电路。电路的 CMOS 部分是使用具有四层金属的低功率铸造 130nm 工艺制造的。氧化铪忆阻器制造在 CMOS 铸造层的顶部。

图示:制造的基于忆阻器的贝叶斯机。(来源:论文)

研究表明,与在采用类似 CMOS 技术制造的微控制器单元(MCU)上标准实施贝叶斯推理相比,所提出的方法提供了几个数量级的能量改进。由于使用了非易失性存储器,系统还具有即时开/关功能:它几乎可以在开机后立即进行贝叶斯推理,让系统在不使用时立即完全切断电源。此外,该系统本身对软错误(即单事件干扰)具有弹性,使其适合在极端环境中使用。

研究专注于手势识别的应用。贝叶斯机的输入是从惯性测量单元 (IMU) 上的时间轨迹中提取的一系列特征。该系统的目标是识别佩戴 IMU 的用户执行的手势:写数字 1、数字 2、数字 3 或签名的手势。该任务由贝叶斯机器的放大版本执行,使用 24(6 列和 4 行)四千比特似然存储阵列。

图示:贝叶斯机器在实际手势识别任务中的应用。(来源:论文)

研究表明,在实际的手势识别任务中,机器的放大设计比微控制器单元上贝叶斯推理的标准实现更节能。

未来,由这组研究人员创建的基于忆阻器的贝叶斯机器可以帮助提高 AI 模型的能效,同时还可能激发其他类似解决方案的开发。它可能对安全关键型应用特别有用,例如用于监控工业设施安全的医疗传感器或电路。

进行这项研究的研究人员之一 Damien Querli 说:「我们设计了一个相当大的贝叶斯机器版本,目前正在制造中,我们也将机器背后的原理应用于其他机器学习方法。随着我们在复杂性上扩展我们的设计,我们开始触及学术团体所能做到的极限。因此,我们同时致力于新技术,下一代忆阻器。」


参考内容:https://techxplore.com/news/2023-01-bayesian-machine-based-memristors.html

相关文章
|
5月前
|
机器学习/深度学习 人工智能 算法
AI-Compass 强化学习模块:理论到实战完整RL技术生态,涵盖10+主流框架、多智能体算法、游戏AI与金融量化应用
AI-Compass 强化学习模块:理论到实战完整RL技术生态,涵盖10+主流框架、多智能体算法、游戏AI与金融量化应用
|
10月前
|
人工智能 数据可视化 API
Deepseek 本地部署“网页版”与“软件版”超级详细教学(deepseek+Ollama+OpenWebUI+Chatbox AI+Cherry Studio)
近期,人工智能领域迎来了一股新的热潮,DeepSeek作为一款备受瞩目的开源语言模型,凭借其卓越的性能和广泛的应用场景,迅速在全球范围内引起了广泛关注。从技术社区到商业领域,DeepSeek的热度不断攀升,甚至有“挤爆”的趋势。这不仅反映了其强大的技术实力,也体现了市场和用户对其的高度期待。 在这样的背景下,本地部署DeepSeek模型的需求也日益增加。本地部署不仅可以避免网络延迟和数据隐私问题,还能根据用户需求进行定制化优化。结合deepseek+Ollama+OpenWebUI+Chatbox AI+Cherry Studio AI等工具,用户可以轻松实现模型的本地化部署,并通过可视化面板
1551 8
Deepseek 本地部署“网页版”与“软件版”超级详细教学(deepseek+Ollama+OpenWebUI+Chatbox AI+Cherry Studio)
|
监控 异构计算
Jetson 学习笔记(八):htop查看CPU占用情况和jtop监控CPU和GPU
在NVIDIA Jetson平台上使用htop和jtop工具来监控CPU、GPU和内存的使用情况,并提供了安装和使用这些工具的具体命令。
1167 0
|
10月前
|
人工智能 安全 数据库
AiCodeAudit-基于Ai大模型的自动代码审计工具
本文介绍了基于OpenAI大模型的自动化代码安全审计工具AiCodeAudit,通过图结构构建项目依赖关系,提高代码审计准确性。文章涵盖概要、整体架构流程、技术名词解释及效果演示,详细说明了工具的工作原理和使用方法。未来,AI大模型有望成为代码审计的重要工具,助力软件安全。项目地址:[GitHub](https://github.com/xy200303/AiCodeAudit)。
|
9月前
|
人工智能 算法 物联网
ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)
通过本篇文章,你可以了解并实践通过【ComfyUI】构建自己的【文生图】和【文生动图】工作流。
ComfyUI:搭积木一样构建专属于自己的AIGC工作流(保姆级教程)
|
机器学习/深度学习 存储 算法
数据结构与算法——BFS(广度优先搜索)
数据结构与算法——BFS(广度优先搜索)
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测中的应用
【7月更文挑战第16天】随着信息技术的飞速发展,企业对IT系统的依赖程度不断加深。传统的运维模式已经难以满足现代业务的需求,智能化运维应运而生。本文将探讨如何通过机器学习技术提高故障预测的准确性,减少系统停机时间,并提升运维效率。我们将分析机器学习在故障预测中的具体应用案例,讨论实施过程中的挑战与对策,以及评估机器学习模型的性能。文章旨在为运维人员提供一种全新的视角和方法,以期达到优化系统稳定性和提升用户体验的目的。
ly~
|
数据可视化 BI API
除了 OpenGL,还有哪些常用的图形库可以在 C 语言中使用?
除了OpenGL,C语言中还有多个常用的图形库:SDL,适合初学者,用于2D游戏和多媒体应用;Allegro,高性能,支持2D/3D图形,广泛应用于游戏开发;Cairo,矢量图形库,支持高质量图形输出,适用于数据可视化;SFML,提供简单接口,用于2D/3D游戏及多媒体应用;GTK+,开源窗口工具包,用于创建图形用户界面。这些库各有特色,适用于不同的开发需求。
ly~
3100 4
|
物联网 开发工具 芯片
nrf52840开发环境搭建
nRF52840是NORDIC公司基于ARM Cortex-M4 CPU和浮点计算单元(FPU)设计的单片机,具有1MB闪存和256kB RAM。主频速率可以达到64MHz
869 0