蚂蚁保险科技获“国际认知识别类技术挑战赛”双冠军

简介: 第29届ACM国际多媒体会议(ACM International Conference on Multimedia)于24日在成都落幕,作为多媒体领域的国际顶级学术会议,本次会议吸引了全球来自中国、美国、德国、澳大利亚、瑞典、法国、日本等19个国家和地区1000余名学者参会,共收到来自近40个国家,共计2000余篇论文,创下了ACM的规模纪录。

第29届ACM国际多媒体会议(ACM International Conference on Multimedia)于24日在成都落幕,作为多媒体领域的国际顶级学术会议,本次会议吸引了全球来自中国、美国、德国、澳大利亚、瑞典、法国、日本等19个国家和地区1000余名学者参会,共收到来自近40个国家,共计2000余篇论文,创下了ACM的规模纪录。

 

蚂蚁保险科技与中国科学院自动化研究所联合组队,参加了多模态认知技术挑战赛“MuSe2021”两个赛道的比赛,摘得两项冠军。

 

76435BC4-11C4-4CF8-90D8-14FA29728E0A_4_5005_c.jpeg

F1A26CC5-DA5F-40C0-9320-11595D0492A4_4_5005_c.jpeg

 

MuSe竞赛全称为The Multimodal Sentiment Challenge,由英国帝国理工学院、德国奥格斯堡大学以及新加坡南洋理工大学等高校共同举办。该挑战赛源于著名的AVEC(Audio-Visual Emotion Challenge)竞赛,自2020年开始在ACM MM会议期间定期举办,是多模态认知技术与心理学交叉学科的顶级赛事。相比于之前的AVEC竞赛,MuSe竞赛面向自然场景和复杂环境,更加注重结合语义信息的多模态深度融合能力的评测。

 

今年,MuSe2021吸引了来自全球的32支队伍参赛,共分为四个赛道,蚂蚁保险科技和与中国科学院自动化研究所组成的参赛队伍参加了其中MuSe-Wilder和MuSe-Sent 两个赛道。在这两个赛道中,参赛者基于官方提供的自然场景下音视频和文本的多模态数据,在唤醒和效价两个维度,分别预测出连续和离散标签。最终,MuSe-Wilder赛道的平均CCC指标相比第二名高0.1191,MuSe-Sent赛道的平均Macro-F1指标相比第二名高0.0671。

 

比赛中,蚂蚁保险科技团队使用了声学、视觉、文本各模态的多种low-level手工设计特征与high-level深度学习表征,并提出一种使用self-attention机制增强的BiLSTM模型,对特征序列中的复杂时序依赖进行建模。同时,采用与评测目标一致的CCC loss和F1 loss替代回归与分类问题中常用的均方误差和交叉熵损失函数,显著提升了模型性能。


在多模态信息融合阶段,业界主流技术分为前融合与后融合两种,由于在该比赛中特征维度过高,前融合效果不佳,蚂蚁保险科技团队采用了后融合方案,引入第二级BiLSTM模型,对每个独立模态的预测结果进行融合,获得了显著优于单模态预测的性能。

 

本次赛事涉及人工智能与心理学的交叉学科,在自然场景的多模态交互中的认知技术是业界的研究热点,众多国际顶级科研机构与科技企业近年来均进行了大力投入。

 

目前,多模态认知与理解技术已经落地于蚂蚁集团的保险、理财、安全、客服等多领域中。譬如,在碎屏险增信、安全反欺诈等场景中起到提升用户体验的积极作用。未来也将在重疾险理赔中发挥重要作用。

相关文章
|
7月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
破壁人AI百度:科技公司反内卷的典型样本
69 1
破壁人AI百度:科技公司反内卷的典型样本
|
人工智能 自然语言处理 自动驾驶
破壁人AI百度:科技公司反内卷的典型样本
简介:破壁人AI百度:科技公司反内卷的典型样本 。
135 0
破壁人AI百度:科技公司反内卷的典型样本
|
人工智能 自然语言处理 自动驾驶
破壁人 AI 百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。
破壁人 AI 百度:科技公司反内卷的典型样本
|
应用服务中间件 nginx
nginx如何重载配置
nginx如何重载配置
|
7天前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
23天前
|
存储 人工智能 弹性计算
阿里云弹性计算_加速计算专场精华概览 | 2024云栖大会回顾
2024年9月19-21日,2024云栖大会在杭州云栖小镇举行,阿里云智能集团资深技术专家、异构计算产品技术负责人王超等多位产品、技术专家,共同带来了题为《AI Infra的前沿技术与应用实践》的专场session。本次专场重点介绍了阿里云AI Infra 产品架构与技术能力,及用户如何使用阿里云灵骏产品进行AI大模型开发、训练和应用。围绕当下大模型训练和推理的技术难点,专家们分享了如何在阿里云上实现稳定、高效、经济的大模型训练,并通过多个客户案例展示了云上大模型训练的显著优势。
|
27天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
18天前
|
并行计算 前端开发 物联网
全网首发!真·从0到1!万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调
2024年11月12日,阿里云通义大模型团队正式开源通义千问代码模型全系列,包括6款Qwen2.5-Coder模型,每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩,成为全球最强开源代码模型,多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点,通过持续训练,结合源代码、文本代码混合数据及合成数据,显著提升了代码生成、推理和修复等核心任务的性能。此外,该模型还支持多种编程语言,并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创,阿里云社区首发,未经同意不得转载。
11734 12
|
12天前
|
人工智能 自然语言处理 前端开发
100个降噪蓝牙耳机免费领,用通义灵码从 0 开始打造一个完整APP
打开手机,录制下你完成的代码效果,发布到你的社交媒体,前 100 个@玺哥超Carry、@通义灵码的粉丝,可以免费获得一个降噪蓝牙耳机。
5396 14
|
19天前
|
人工智能 自然语言处理 前端开发
用通义灵码,从 0 开始打造一个完整APP,无需编程经验就可以完成
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。本教程完全免费,而且为大家准备了 100 个降噪蓝牙耳机,送给前 100 个完成的粉丝。获奖的方式非常简单,只要你跟着教程完成第一课的内容就能获得。
9611 15