《中国人工智能学会通讯》——11.17 基于聚类规则项的多任务聚类方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.17节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.17 基于聚类规则项的多任务聚类方法

多任务学习方法能够对交通路网中的多个节点同时进行分析,这满足了交通的网络性特点所提出的要求。进一步的,异质的多任务学习方法又对应了交通中关联关系的异质性特点。图 2 给出了我国山西省高速交通路网的交通流分配情况,可以看出,交通路网中异质的车流常常存在局部集中的特点,如果将这些车流集中的局部区域标记出来,则可以得到图中的聚类模式。假设当前要学习的任务是高速路网中出口流量的预测问题,那么图 2(a) 则表示出了这些预测任务的聚类模式示意图,图中红色的虚线圆圈可以看作出口的聚类,其意义在于同一个类簇中的出口预测任务是高度相关的,那么相应的基于任务聚类的多任务学习方法便可以应用于交通流分析。然而,将目前已有的多任务聚类方法直接应用于交通场景并不恰当,因为目前的基于任务聚类的多任务学习方法都需要在学习之前先指定任务类簇的数目,但这一数目在真实交通问题中是未知的,例如图 2(a) 中虚线圆圈的个数。本章针对现有基于任务聚类的多任务学习方法的不足,提出了一种基于聚类规则项的多任务聚类方法 (CRMTL, Clustered Regularization based Multi-Task Learning)。该方法采用一种新颖的聚类规则项,其优点在于不需要事先指定任务聚类的个数,而是从数据中自主地学习出聚类结构。该模型的目标函数形式如下:image
其中,y i 和 X i 分别为第 i 个任务 ( 共 m 个任务 ) 的输入和输出;W 为模型参数,w i 为矩阵 W 的第 i 列;λ 为规则项系数。式 (1) 中的第一项为损失函数;第二项为聚类规则项,该规则项对任意两个任务列向量的差值添加第二范式,其作用是迫使任意两个任务 i 和 j 尽可能的相似,从而将相似的任务聚类。λ控制了聚类的强度,当 λ 越大时,聚类的个数越少。上述聚类规则项的优点是不需要事先给定任务聚类的数目,而是通过规则项对任务列向量进行约束,从数据中自主地学习出任务聚类模式。image
注意,式 (1) 中的聚类规则项image 不同于特征学习中的特征聚类规则项 Fused Lasso [3] 。Fused Lasso 规则项用于对特征进行聚类,其特点是对任意两个标量做差,然后取所有差值的绝对值的和作为规则项。而式 (1) 中的聚类规则项是对任意两个向量做差,然后取所有差值向量的第二范式的求和作为规则项。求解基于向量差值的规则项要比求解基于标量差值的规则项更困难[4] 。

命题 1 式 (1) 中的目标函数为凸函数 (Convex),其中的聚类规则项为非光滑 (Non-Smooth) 函数。

命题 1 给出了 CRMTL 模型目标函数的求解性质。虽然式 (1) 中的优化问题为凸函数优化问题,然而聚类规则项却为非光滑的函数。这使得式 (1)的梯度无法直接求得,因此基于梯度的优化方法无法直接使用。在机器学习方法中,常用的处理非光滑函数的方法为次梯度 (Sub-Gradient) 法[5] ,然而该方法的计算非常耗时。因此,求解 CRMTL 模型较为困难。本文提出了一种针对 CRMTL 的高效光滑近似优化算法 ( 详细内容请参看全文 )。

相关文章
|
人工智能 搜索推荐
写歌词的技巧和方法:塑造完美歌词结构的艺术,妙笔生词AI智能写歌词软件
歌词是音乐的灵魂,其结构艺术至关重要。开头需引人入胜,主体部分无论是叙事还是抒情,都应层次分明、情感丰富,结尾则需升华或留白,给人以深刻印象。《妙笔生词智能写歌词软件》提供多种AI辅助功能,助你轻松创作完美歌词,成为音乐创作的得力助手。
|
6月前
|
人工智能 自然语言处理 物联网
GEO优化方法有哪些?2025企业抢占AI流量必看指南
AI的不断重塑传统的信息入口之际,用户的搜索行为也从单一的百度、抖音的简单的查找答案的模式,逐渐转向了对DeepSeek、豆包、文心一言等一系列的AI对话平台的更加深入的探索和体验。DeepSeek的不断迭代优化同时,目前其月活跃的用户已破1.6亿,全网的AI用户规模也已超过6亿,这无疑为其下一阶段的迅猛发展提供了坚实的基础和广泛的市场空间。
|
11月前
|
机器学习/深度学习 人工智能 算法
智创 AI 新视界 -- 提升 AI 推理速度的高级方法(16 - 2)
本文深度聚焦提升 AI 推理速度,全面阐述模型压缩(低秩分解、参数量化)、硬件加速(GPU、TPU)及推理算法优化(剪枝感知推理、动态批处理)。结合图像识别等多领域案例与丰富代码示例,以生动形象且专业严谨的方式,为 AI 从业者提供极具价值的技术指南,助力突破 AI 推理速度瓶颈,实现系统性能跃升。
|
7月前
|
人工智能 数据安全/隐私保护 异构计算
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
1047 8
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
|
7月前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
463 4
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
2098 8
|
8月前
|
人工智能 JSON 监控
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
AI Agent的评估需覆盖其整个生命周期,从开发到部署,综合考量事实准确性、推理路径、工具选择、结构化输出、多轮对话及实时性能等维度。LangSmith作为主流评估平台,提供了一套全面的评估框架,支持12种评估技术,包括基于标准答案、程序性分析及观察性评估。这些技术可有效监控Agent各组件表现,确保其在真实场景中的稳定性和可靠性。
3346 0
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
|
12月前
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
326 1