AAAI/CVPR论文详解 | 万字长文了解可解释AI工具及技术的最新进展(3)

简介: AAAI/CVPR论文详解 | 万字长文了解可解释AI工具及技术的最新进展

最后,iCSNs 的模块化特点还具有交互式在线学习能力。例如,当模型提供包含新概念的数据样本时,或当数据中存在的一个因素最初被认为不重要,但在初始学习阶段被认为很重要时,在这两种情况下,交互的方法取决于要学习的概念的层次结构,即它是基本概念还是上位概念。假设人类用户对 iCSN 之前的概念表示满意,并且 J(每个代码本的原型槽总数)被设置为高估,用户可以简单地通过相关类别的一个未使用的原型插槽给出反馈以表示新的基本概念。如果需要学习一个新的上位概念,可以在初始训练阶段通过添加额外的 read-out 编码器来实现。与其他 read-out 编码器相比,该编码器不映射到原型插槽的空间。最终,可以训练 iCSN 的初始潜在空间 z 来表征完整的数据分布。为了包含最初被认为不相关的概念,可以只扩展 J,这意味着添加一个新的 read-out 编码器 m_J+1(z)=φ_J+1 和代码本 P_J+1 到 iCSN。然后,m_J+1 学习将新的基本概念从 “新的” 上位概念绑定到 p_J+1,p_J+1 只需要新的数据对来举例说明以前不重要的概念。

本文提出了一个新的基准数据集:基本概念推理(Elementary Concept Reasoning,ECR),如图 11。ECR 由恒定颜色背景上二维几何对象的 RGB 图像(64×64×3)组成。对象的形状(圆形、三角形、正方形和五边形)、大小(大小)和颜色(红色、绿色、蓝色、黄色)可以不同。为每种颜色添加均匀的抖动,从而产生不同的色调。每个图像都包含一个固定在图像中心的对象。对图像进行配对处理,使单个图像中的对象至少共享 1 个、最多共享 J− 1 个共有属性。ECR 包含 5000 个图像对和 2000 个用于验证的图像的训练集。

图 11. 基本概念推理数据集样本。每张样本图像(左)描绘了一个居中的二维物体,具有三种不同的属性:颜色、形状和大小。对图像进行配对,使得这些物体共享一个和两个概念(右)

在本文实验中,作者将 iCSN 与几个基线方法进行比较,包括无监督训练的β-VAE 和使用编码器分布的算术平均值的 Ada-VAE。为了与通过共享匹配配对训练的 iCSN 和 Ada-VAE 进行公平的比较,最初将 Ada-VAE 作为一种较弱的监督形式引入,作者也用已知的共享因子 ID 训练 Ada-VAE。这个基线本质上类似于β-VAE,在已知的共享因子 ID 处对图像进行编码器分布的平均化。这一方法在本文实验结果中表示为 VAE。最后,作者将 iCSN 与一个离散化的 VAE 方法进行比较,该方法通过 Gumbel-softmax 技巧使用分类分布(Cat-VAE)。Cat-VAE 的训练方式与 VAE 相同,即通过份额配对和编码器分布的平均化。

作者通过线性探测研究每个模型的潜在编码。表 6(上)中的结果记录了不同模型在五次随机初始化过程中所进行验证集的平均精度和标准偏差。我们观察到,CSN 的潜在编码具有近乎完美的预测性能,并且超过了所有变分方法。重要的是,CSN 的表现甚至超过了 VAE 方法(VAE 和 Cat VAE),后者与 CSN 在同样类型的弱监督下接受训练。β-VAE 的平均性能比弱监督模型差。然而,Ada-VAE 的表现比β-VAE 差。此外,Cat VAE 的离散潜在表征也比 CSN 表现差。Cat VAE 运行情况表明性能存在较大偏差,同时表明多个 Cat VAE 运行收敛到次优状态。总之,尽管 ECR 数据集仅包含单个 2D 几何对象的变化,但基线模型的性能不如 CSN,即使使用相同数量的信息进行训练。

表 6. 通过决策树(DT)和逻辑回归(LR)进行线性探测。(上)对 iCSN 模型和各种基线的 latent codes 进行探测。(下)通过对 Cat-VAE 的 latent codes 进行探测,并进行编码器分布交换和 iCSN 概念编码平均化的消融研究。所有的分类准确率都是在测试集上计算出来的

iCSN 的语义约束离散潜在空间的一个优点是,人类用户可以直接识别次优概念表征,见上文所示的图 8。在识别正确或错误学习的概念后,用户可以在这个离散的概念空间上应用简单的逻辑反馈规则。具体来说,在通过弱监督进行训练后,建议机器和人类用户讨论所学的概念,并确定这些概念是否与用户的知识一致,或者是否需要修改。例如,iCSN 可以学习在几个原型插槽上表示颜色,或者通过一个插槽表示两个形状,这表明它错误地认为这些形状属于同一个概念。然后,iCSN 可以通过两种方式传达其学到的概念。首先,它可以根据推断出的离散原型距离代码对共享一个概念的新图像进行分组,并询问人类用户分组后的图像是否确实共享一个共同的基本概念,如图 8 所示。其次,利用解码器,它可以呈现每个学习概念的原型重建,例如,呈现具有蓝色原型阴影的对象,参见上文所示的图 9。在确定了潜在的次优概念表征之后,人类用户可以通过逻辑规则在 iCSNs 的离散化潜在空间上进行交互,并进一步改进表征。

对于之前所有的 vanilla CSN 配置,人工检查了 32 个可能的概念组合中的一个示例的概念编码 y,并确定了在每个单独概念的大多数示例中 “激活” 的原型插槽(主插槽),此外,根据概念识别那些在示例子集(辅助插槽)中从未激活或很少激活的原型插槽。接下来,在 y 上应用 L2 损失,使用原始重建损失和该额外 L2 损失微调原始训练集上的先前运行结果。这种反馈的语义是,应该只由主要原型槽来表示概念。此外,在两次运行中,修改了一个观察到的次优解,即五边形和圆绑定到同一原型插槽。因此,在训练集的所有五边形样本上提供反馈,以绑定到另一个空的原型插槽,并再次通过额外的 L2 损失约束优化。

5 小结

我们在这篇文章中从可解释性工具的研发角度讨论了可解释 AI 问题,讨论的依据是 AAAI-2022 tutorial 中提及的最新研究成果。目前,国内外关于可解释 AI 真正落地的应用还比较少,主要集中在几个超大型公司,而学术界对这一问题的关注也远不如其它 AI 领域多。但是随着数字经济的重要性越来越高,平台企业的合规性发展成为了下一步 AI 算法 / 模型应用的关键。此外,从监管端来说,促进可解释 AI 的发展也是有效监管数字经济的重要抓手。最后,可解释 AI 也是我们广大用户应用 AI 模型的定心石。随着越来越多国内大型企业对可解释 AI 的重视度不断提升,相信可解释 AI 会很快在大量的应用场景中使用,可解释性工具的研发也会受到更多研究人员的关注。

本文参考引用的文献

[1] Bach S , Binder A , Montavon G , et al. On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation, PLOS ONE, 2015, 10

[2] Tutorial on Explanations in Interactive Machine Learning,AAAI 2022,https://sites.google.com/view/aaai22-ximl-tutorial

[3] Lertvittayakumjorn et al., 2020, FIND: Human-in-the-Loop Debugging Deep Text Classifiers, EMNLP 2020

[4] Teodora Popordanoska, Mohit Kumar, Stefano Teso, Human-in-the-Loop Debugging Deep Text Classifiers,AAAI 2021

[5] Stammer, W. , et al. "Interactive Disentanglement: Learning Concepts by Interacting with their Prototype Representations." CVPR 2022


仵冀颖,工学博士,毕业于北京交通大学,曾分别于香港中文大学和香港科技大学担任助理研究员和研究助理,现从事电子政务领域信息化新技术研究工作。主要研究方向为模式识别、计算机视觉,爱好科研,希望能保持学习、不断进步

关于机器之心全球分析师网络

Synced Global Analyst Network


机器之心全球分析师网络是由机器之心发起的全球性人工智能专业知识共享网络。在过去的四年里,已有数百名来自全球各地的 AI 领域专业学生学者、工程专家、业务专家,利用自己的学业工作之余的闲暇时间,通过线上分享、专栏解读、知识库构建、报告发布、评测及项目咨询等形式与全球 AI 社区共享自己的研究思路、工程经验及行业洞察等专业知识,并从中获得了自身的能力成长、经验积累及职业发展。

相关文章
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,基于DeepSeek V3,支持快速生成React和Tailwind CSS代码,适合快速原型开发和前端组件构建。
374 38
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
|
5天前
|
人工智能 自然语言处理 语音技术
FilmAgent:多智能体共同协作制作电影,哈工大联合清华推出 AI 驱动的自动化电影制作工具
FilmAgent 是由哈工大与清华联合推出的AI电影自动化制作工具,通过多智能体协作实现从剧本生成到虚拟拍摄的全流程自动化。
65 10
FilmAgent:多智能体共同协作制作电影,哈工大联合清华推出 AI 驱动的自动化电影制作工具
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
185 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
18天前
|
人工智能 资源调度 JavaScript
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。
236 18
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
|
13天前
|
人工智能 达摩院 计算机视觉
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
SHMT 是阿里达摩院与武汉理工等机构联合研发的自监督化妆转移技术,支持高效妆容迁移与动态对齐,适用于图像处理、虚拟试妆等多个领域。
49 9
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
|
10天前
|
机器学习/深度学习 人工智能 文字识别
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
Zerox 是一款开源的本地化高精度OCR工具,基于GPT-4o-mini模型,支持PDF、DOCX、图片等多种格式文件,能够零样本识别复杂布局文档,输出Markdown格式结果。
61 4
Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
|
24天前
|
存储 人工智能 自然语言处理
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
AI Agent以自主性和智能化为核心,适合复杂任务的动态执行;而SaaS工具则注重服务的完整性和易用性,适合标准化业务需求。
90 14
AI Agent与SaaS工具协同发展的未来:企业智能化的全新范式
|
18天前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
65 27
|
9天前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
40 16
|
18天前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
76 22