中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.3 最优传输映射的逼近算法

简介:

1.3 最优传输映射的逼近算法

image
image

近年来,依随 Internet 技术的发展,人类 已经积累了大量的视觉数据,这使得估计各 种概率分布成为可能。同时,GPU 技术的发 展,使得各种统计计算方法的实现成为可能。 因此,我们迎来了机器学习的科技大潮。但 是,我们依然无法严密解释机器学习算法的 有效性。从基础理论角度而言,研究概率分 布的一个强有力工具是最优传输理论(optimal mass transportation theory),这个理论着重揭 示概率分布这一自然现象的内在规律,因此 并不从属于某个学派,也不依赖于具体的算 法。相反,这一理论会为算法的发展提供指导, 同时真正合理有效的算法(例如机器学习算 法),应该可以被传输理论来解释。

简而言之,传输理论给出了概率分布 所构成空间的几何。给定一个黎曼流形, 其上所有的概率分布构成一个无穷维的空 间:Wasserstein 空间,最优传输映射的传输 代价给出了 Wasserstein 空间的一个黎曼度 量。Wasserstein 空间中的任意两点可以用 Wasserstein 距离来测量相近程度,自然也可 以用测地线来插值概率分布。每个概率分布 有熵,沿着测地线熵值的变化规律和黎曼流 形的曲率有着本质的关系。

但在实际计算中,高维的最优传输映射, Wasserstein 距离的计算相对复杂。一个自然 的想法是降维,将高维空间的概率分布投影 到低维子空间,在低维空间上计算边际分布 之间的变换。这有些象盲人摸象,每次得到 局部信息,如果摸得充分,我们也可以恢复 大象的整体信息。

在视觉问题中,通常图像全空间的维数 非常高,计算难度较高。因此,我们可以 放弃理论上的最优性,寻找更加简单有效, 同时又和最优传输映射近似的算法。下面 我们就讨论这些更为实用的算法及其背后 的理论。

1. 直方图均衡化

image
image

2. 迭代分布传输算法

image
image

3. 投影 Wasserstein 距离梯度下降法

image
image

4. 逼近算法的局限性和脆弱性

拉东变换将联合概率分布转换成向所有 一维子空间投影所得的边际概率分布,从而 实现了降维,简化了计算。但是,如果有一 些子空间的边际分布缺失,我们无法精确恢 复原来的联合分布。在视觉问题中,每个线 性子空间被视为一个特征,向子空间投影, 等价于特征提取。

深度神经网在解决视觉分类问题中表 现出色,但是也非常容易被愚弄。如图 20 所示,人类可以轻易看出这些是非自然图像,在现实生活中不具有任何意义。但是 深度神经网络非常自信地将它们归结为训 练过的类别。如果以欣赏现代抽象艺术的 心态来研究这些图像,我们能够领会到深度神经网络分类结果的内在合理性:这些 图像的确具有它们所对应类别的内在“神 韵”。从纹理层次而言,它们和对应类别的 纹理非常“神似”;从语义层面而言,这 些图像则是无意义的和荒谬的。

image

对此我们可以给出一种解释,那就是投 影子空间选得不够,因此即便是在这些子空 间上边际概率分布相似,但是联合概率分布 依然相差很大。深度神经网所得到的训练集 是自然图像,图 21 所示的这些图像都在自然 图像空间之外,但是投影在所选择的子空间 后,自然图像和非自然图像无法进行分别。 由此,引发了深度神经网络脆弱性。

5. 讨论

人类的低级视觉在很大程度上依赖于统 计特性,因此可以归结为对概率分布的处理 和演算。人脑是否真的在计算最优传输映射、 计算 Wasserstein 距离?在历史上人类经常首 先发现某些数学原理,然后又发现这些原理 在生物器官上早已应用。例如,人类首先发 现了傅里叶分解原理,然后发现人类耳蜗神 经结构就是在对声音信号进行傅里叶分解; 又如,人类首先发现了保角变换(共形变换), 后来发现从视网膜到第一级视觉中枢的映射 就是保角变换,如图 21 所示。这项工作曾 经获得过诺贝尔奖。因此,如果若干年后人 们证实大脑的确是在计算概率分布之间的距 离,我们也不会觉得意外。

image

因此,我们相信在一些视觉应用中,深 度神经网络隐含地构建概率模型,可以直接 用概率的工具,例如最优传输理论及其各种 降维近似,直接取代神经网络,从而使得机 器学习的黑箱变得透明。

image

相关文章
|
13天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
66 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
4天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
6天前
|
机器学习/深度学习 数据采集 JSON
Pandas数据应用:机器学习预处理
本文介绍如何使用Pandas进行机器学习数据预处理,涵盖数据加载、缺失值处理、类型转换、标准化与归一化及分类变量编码等内容。常见问题包括文件路径错误、编码不正确、数据类型不符、缺失值处理不当等。通过代码案例详细解释每一步骤,并提供解决方案,确保数据质量,提升模型性能。
123 88
|
11天前
|
机器学习/深度学习 数据采集 算法
机器学习在生物信息学中的创新应用:解锁生物数据的奥秘
机器学习在生物信息学中的创新应用:解锁生物数据的奥秘
110 36
|
12天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
77 31
|
8天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
83 23
|
15天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
64 23
|
3天前
|
人工智能 缓存 安全
每一个大模型应用都需要一个 AI 网关|场景和能力
本次分享的主题是每一个大模型应用都需要一个 AI 网关|场景和能力。由 API 网关产品经理张裕(子丑)进行分享。主要分为三个部分: 1. 企业应用 AI 场景面临的挑战 2. AI 网关的产品方案 3. AI 网关的场景演示
|
5天前
|
人工智能 自然语言处理 搜索推荐
云端问道12期实操教学-构建基于Elasticsearch的企业级AI搜索应用
本文介绍了构建基于Elasticsearch的企业级AI搜索应用,涵盖了从传统关键词匹配到对话式问答的搜索形态演变。阿里云的AI搜索产品依托自研和开源(如Elasticsearch)引擎,提供高性能检索服务,支持千亿级数据毫秒响应。文章重点描述了AI搜索的三个核心关键点:精准结果、语义理解、高性能引擎,并展示了架构升级和典型应用场景,包括智能问答、电商导购、多模态图书及商品搜索等。通过实验部分,详细演示了如何使用阿里云ES搭建AI语义搜索Demo,涵盖模型创建、Pipeline配置、数据写入与检索测试等步骤,同时介绍了相关的计费模式。
|
12天前
|
人工智能 算法 搜索推荐
阿里云百炼xWaytoAGI共学课开课:手把手学AI,大咖带你从零搭建AI应用
阿里云百炼xWaytoAGI共学课开课啦。大咖带你从零搭建AI应用,玩转阿里云百炼大模型平台。3天课程,涵盖企业级文本知识库案例、多模态交互应用实操等,适合有开发经验的企业或独立开发者。直播时间:2025年1月7日-9日 20:00,地点:阿里云/WaytoAGI微信视频号。参与课程可赢取定制保温杯、雨伞及磁吸充电宝等奖品。欢迎加入钉钉共学群(群号:101765012406),与百万开发者共学、共享、共实践!