再见AI黑匣子:研究人员教会AI进行自我解释

简介: AI决策过程的黑匣子问题一直是AI领域最大的担忧之一,但近期黑匣子决策问题似乎被破解。来自加州大学伯克利分校、阿姆斯特丹大学、Facebook AI Research团队的研究人员创建出一个AI自我解释模型,该模型可使AI在回答问题时指出问题对应的证据,在回答相关图像问题时,其能够为其决策提供自然语言理由并指出图像显示证据。

来自加州大学伯克利分校、阿姆斯特丹大学、Facebook AI Research团队的研究人员创建出一个AI自我解释模型,该模型可使AI在回答问题时指出问题对应的证据,在回答相关图像问题时,其能够为其决策提供自然语言理由并指出图像显示证据。

 “黑匣子”变得透明,这是一件大事。

在许多环境中,深度模型既有效又可解释;先前可解释的模型是单峰模型,提供了基于图像的注意权重的可视化或基于文本的事后理由的生成。

这次的研究提出了一种多模式的解释方法,并且认为这两种模式提供了互补的说明性优势。

团队收集两个新的数据集来定义和评估这个任务,并提出一个新的模型,可以提供联合文本理性和可视化生成。我们的数据集定义了活动识别任务(ACT-X)和视觉问题解答任务(VQA-X)的分类决策的视觉和文本理由。

在数量上表明,使用文本解释进行培训不仅可以产生更好的文本理由模型,还可以更好地定位支持决策的证据。我们还定性地展示了视觉解释比文本解释更具洞察力的情况,反之亦然,支持我们的论点:多模式解释模型提供了超越单峰方法的显着优势。

3eea46c2cff21190852d8f4f42ed4f8f1b118e6e

VQA-X定性结果:对于每个图像,PJ-X模型提供了答案和理由,并指出了该理由的证据。

弄清楚为什么一个神经网络做出它所做的决定是人工智能领域最大的担忧之一。正如它所称的那样,黑盒问题实际上使我们不能相信AI系统。

像人类一样,它可以“指出”它用来回答问题的证据,并且通过文本可以描述它如何解释证据。它的开发旨在回答那些需要九岁小孩平均智力的问题。

这是人们第一次创建了一个可以用两种不同方式解释自己的系统:

我们的模型是第一个能够为决策提供自然语言理由并指向图像中的证据的人。

研究人员开发了AI来回答关于图像的简单语言查询。它可以回答关于给定场景中的对象和动作的问题。它通过描述它看到的内容并突出显示图像的相关部分来解释它的答案。

它并不总是让事情正确。在实验过程中,人工智能感到困惑,无法确定一个人是否在微笑,也无法分辨出一个人在使用吸尘器的人和一个正在使用吸尘器的人之间的区别。

但是,这是一个重点:当电脑出现问题时,我们需要知道原因。

为了达到任何可衡量的成熟度,AI的领域需要调试,错误检查和理解机器决策过程的方法。神经网络发展并成为我们数据分析的主要来源时尤其如此。

为人工智能展示其工作并以外行人员的角度解释自己,这是一个巨大的飞跃,可以避免每个人似乎都很担心的机器人启示。


原文发布时间为:2018-03-1

本文作者:艾霄葆

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:再见AI黑匣子:研究人员教会AI进行自我解释

相关文章
|
2月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
6月前
|
机器学习/深度学习 人工智能 文字识别
UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。
214 0
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
|
5月前
|
机器学习/深度学习 人工智能 自动驾驶
AI Agent多模态融合策略研究与实证应用
本文从多模态信息融合的理论基础出发,构建了一个结合图像与文本的AI Agent模型,并通过PyTorch代码实现了完整的图文问答流程。未来,多模态智能体将在医疗、自动驾驶、虚拟助手等领域展现巨大潜力。模型优化的核心是提升不同模态的协同理解与推理能力,从而打造真正“理解世界”的AI Agent。
AI Agent多模态融合策略研究与实证应用
|
5月前
|
机器学习/深度学习 人工智能 算法
深度强化学习在异构环境中AI Agent行为泛化能力研究
随着人工智能技术的迅猛发展,AI Agent 在游戏、智能制造、自动驾驶等场景中已逐步展现出强大的自适应能力。特别是深度强化学习(Deep Reinforcement Learning, DRL)的引入,使得智能体能够通过与环境的交互,自动学习最优的行为策略。本文将系统性地探讨基于深度强化学习的AI Agent行为决策机制,并结合代码实战加以说明。
深度强化学习在异构环境中AI Agent行为泛化能力研究
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破
原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破
225 1
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 驱动:如何用AI直接生成矢量 Logo? 技术研究与工具选择
AI 技术革新品牌标志设计,通过深度学习分析数据,精准把握市场趋势,智能生成高辨识度 Logo。矢量格式(SVG)确保清晰不失真,适配各类展示场景。AI 工具高效便捷,支持个性化定制,助力品牌快速打造专业视觉形象,成为市场竞争中的有力武器。
348 0
|
8月前
|
机器学习/深度学习 人工智能 搜索推荐
AutoGLM沉思:智谱AI推出首个能"边想边干"的自主智能体!深度研究+多模态交互,颠覆传统AI工作模式
AutoGLM沉思是由智谱AI推出的一款开创性AI智能体,它突破性地将深度研究能力与实际操作能力融为一体,实现了AI从被动响应到主动执行的跨越式发展。
768 16
AutoGLM沉思:智谱AI推出首个能"边想边干"的自主智能体!深度研究+多模态交互,颠覆传统AI工作模式
|
6月前
|
数据采集 人工智能 定位技术
AI尝鲜:DeerFlow,可以使用MCP的深度研究工具
DeerFlow(Deep Exploration and Efficient Research Flow)是一个社区驱动的深度研究框架,它建立在开源社区的杰出工作基础之上。我们的目标是将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,同时回馈使这一切成为可能的社区。
|
9月前
|
存储 人工智能 搜索推荐
Shandu:开源AI研究黑科技!自动挖掘多层级信息,智能生成结构化报告
Shandu 是一款开源的 AI 研究自动化工具,结合 LangChain 和 LangGraph 技术,能够自动化地进行多层次信息挖掘和分析,生成结构化的研究报告,适用于学术研究、市场分析和技术探索等多种场景。
787 8
Shandu:开源AI研究黑科技!自动挖掘多层级信息,智能生成结构化报告