让AI认出「生狗」?Facebook构建能感知变化算子的人工智能

简介: Facebook AI的最新研究在如何训练人工智能像人类一样感知周遭的细微变化方面取得了一些进展。

                    微信图片_20220113000253.jpg

 新智元报道  

来源:Facebook AI

编辑:LQ

【新智元导读】Facebook AI的最新研究在如何训练人工智能像人类一样感知周遭的细微变化方面取得了一些进展。


一条狗,即使是之前从未见过的品种、颜色,我们也能一眼认出它。

 

对周遭任何变化的感知是人类与生俱来的能力。

 

但是人工智能系统就不一样了,即使级别SOTA,能完成无数人类完成不了的任务,但也有很多对人类来说轻而易举的事情,它却搞不定,比如,让金毛换个角度:正面、侧面、前面、后面,人工智能可能会识别地很挣扎。

 

深度学习模型擅长解释像素和标签之间的统计模式,但却很难通过许多潜在的自然变化正确识别对象。

 

那是扫雪机在路上扫雪吗?还是一辆校车侧翻了?


微信图片_20220113000257.png

上图是根据M.A. Alcorn等人的 "Strike(with)a pose: Neural networks are easily fooled by strange poses of familiar objects"绘制,显示了一个深度神经网络将一辆公共汽车错误地分类为扫雪车。 


人类可以瞬间知道,但是颜色、大小和透视等因素使情况复杂化,增加了人工智能模型的预测难度。

 

Facebook AI一直在探索如何更好地捕捉自然变化,在这方面,传统解决方案有很大局限性,即所谓的解纠缠(disentanglement)。我们最近还提出了等变化移位算子(equivariant shift operator)的概念,这是一种替代解的概念证明,可以帮助模型理解通过模拟最常见的变换,物体可能会发生怎样的变化。

 

目前,Facebook AI在这方面的工作主要是理论性的,但是对于深度学习模型,特别是计算机视觉潜力巨大: 增加了可解释性和准确性,即使在小数据集上训练也有更好的性能,并提高了泛化能力。Facebook AI希望这些贡献能够使计算机视觉向前推进一步,更好地理解视觉世界的复杂性。

 

现行方法的局限


目前的解纠缠方法试图通过将模型中的每个因子编码到模型内部表示的一个单独的子空间中,来学习模型中对象的基本变换。

 

例如,解纠缠可能将狗图像的数据集编码为姿态、颜色和品种子空间。




微信图片_20220113000300.png



这种方法在识别刚性数据集的变化因素方面很有优势,比如一个单一的 MNIST 数字或者一个单一的对象,比如一把椅子,但是我们已经发现,在多个分类中,解纠缠的表现很差。

 

想象一下多个旋转的形状,比如三角形和正方形。解纠缠模型试图将物体的形状和方向这两个变化因素分离成两个变化因素。

 

下图说明了传统的解纠缠是无法在多个形状的数据集中孤立旋转的。我们期望高亮显示的形状会旋转,但是由于解纠缠失败,形状仍然是固定的。


 微信图片_20220113000302.png


解纠缠还带来了拓扑缺陷,这是一系列众多变换中的另一个问题。拓扑缺陷违背连续性——深度学习模型的本质属性。如果没有连续性,深度学习模型可能很难有效地学习数据中的模式。


微信图片_20220113000305.png


想象一下正三角形的旋转。旋转120度的正三角形与原来的三角形无法区分,导致在方向空间中有相同的表示。然而,通过在三角形的一个角上加一个无穷小的点,表示变得可辨别,违反了连续性。附近的图像映射到相距较远的图像。Facebook AI的研究还表明,拓扑缺陷出现在非对称形状和许多其他常见的变换中。

 

利用等变化算子揭示变化因子

 

与其将每个转换限制为一个表示的一个组件,如果转换可以改变整个表示呢?这种方法的目标是发现能够操纵图像及其表示的操作符ーー每个变化因子的一个操作符。这些被称为等变量。

 


微信图片_20220113000308.png


有一个数学分支「群论」可以教我们应用等变化算子的很多知识。它表明,一个直观的方式来理解变化因素是将他们模拟为一组转换。例如,一个三角形的旋转有一个组的结构: 90度旋转和30度旋转结合起来产生120度旋转。

 

Facebook AI利用这些想法来识别传统解纠缠的缺点,并确定如何训练等变化算子来解纠缠。我们提出了一个等变化算子,称为移位算子。这是一个矩阵,其块体模仿了常见变换的组结构--旋转、平移和重缩放。然后在原始图像和它们的转换上训练一个人工智能模型。


 微信图片_20220113000310.png 


这样就会发现,即使在包含多个类的数据集中,移位算子也能成功地学习变换--这正是传统解纠缠经常失败的条件。

 

未来

 

基于群论的等变模型极大地扩展了解纠缠的研究范围,现有的模型依赖于强有力的监督,例如先验地理解利益的转化,并在模型中加以实施。

 

但是,如何使用最少量的监督发现一个数据集的对称性?以前在这个领域的研究主要应用于合成数据,所以当他们面对不寻常的观察时,如一辆公共汽车侧面或一只狗的嘴里有一个超大的玩具时,基本对称性的知识可以使模型更加可靠。

 

人类通过直观地将不明物体与以前见过的物体进行比较来识别不明物体。模型可以被训练成与图像子部分的变换相等,而且关键的是,当遇到未知对象时,模型可以重新组合子部分。

 

最后,用基于群论的模型处理真实数据集是具有挑战性的,因为群体结构没有得到完全尊重。例如,当在非均匀背景中旋转一个物体时,有许多方法可以推断出旋转后出现的像素值。将这个想法扩展到更真实的设置和数据集,例如没有人工增强的图像,可能会被证明是一个有价值的方法。

 

参考资料:

https://ai.facebook.com/blog/building-ai-that-can-understand-variation-in-the-world-around-us/?utm_source=hootsuite&utm_medium=twitter&utm_term=facebookai&utm_content=05497535-f801-43ff-9b92-c4537125b3aa&utm_campaign=AI%20Blog

相关文章
|
2月前
|
人工智能 运维 算法
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
AI来了,运维不慌:教你用人工智能把团队管理提速三倍!
349 8
|
5月前
|
机器学习/深度学习 人工智能 运维
AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?
AI望远镜:人工智能是如何发现“藏在宇宙角落的新星系”的?
312 64
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
309 120
|
6月前
|
人工智能 JavaScript
生成式人工智能(GAI)认证:2025最值得考的AI证书!
生成式人工智能(GAI)认证由全球教育巨头 Pearson 推出,融合技术原理、实战应用与伦理合规的三维培养框架。该项目与 AI 领域领先企业合作开发,涵盖提示优化、基础提示工程及社会影响等核心内容,助力学习者全面掌握 GAI 技能。中文版认证已落地中国,由达内教育与恒利联创战略合作推广,深度融合本土 AI 平台。作为高含金量的全球认可证书,GAI 认证可提升职业竞争力,满足行业对复合型 AI 人才的需求,为个人和企业开辟数字时代新机遇。
|
3月前
|
存储 人工智能 搜索推荐
Mem0 + Milvus:为人工智能构建持久化长时记忆
Mem0 为AI打造持久记忆层,结合Milvus向量数据库,让智能体记住用户偏好、追溯历史对话,实现个性化持续交互,告别“健忘”AI。
Mem0 + Milvus:为人工智能构建持久化长时记忆
|
2月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
276 4
|
3月前
|
机器学习/深度学习 数据采集 人工智能
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
141 5
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI人工智能评审管理系统:用技术为决策装上“智能导航”
AI评审系统融合NLP、知识图谱与机器学习,破解传统评审效率低、标准不一难题。通过语义解析、智能推理与风险预判,构建标准化、可复用的智能评审流程,助力项目质量与效率双提升。(238字)

热门文章

最新文章