近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文(2)

简介: 近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文

论文介绍:三维点云配准 (PCR) 是计算机视觉中的一个基本问题,目的是寻找点云对对齐的最优姿态。

该研究提出了一种基于最大团(maximal cliques,MAC)的 3D 配准方法。关键创新是放宽了对先前最大团的约束,并在图中挖掘更多的局部一致性信息,以生成准确的位姿假设。

研究者在对 U3M、3DMatch、3DLoMatch 和 KITTI 进行了大量的实验后证明,MAC 有效地提高了配准的准确性,优于各种最先进的方法,并提升了深度学习(deep-learned)方法的性能。MAC 与深度学习方法的结合在 3DMatch 和 3DLoMatch 上实现了 95.7% / 78.9% 的配准召回率,达到了最先进的水平。

1)构建兼容性图以呈现初始对应关系之间的关联关系。

在一个低重叠的点云对上,最大团( maximal )和最大限度(maximum)团之间的比较


MAC 在技术上非常简单,Pipeline 如图所示。


最佳论文提名

最佳论文提名颁给了谷歌和康奈尔大学的《DynIBaR: Neural Dynamic Image-Based Rendering》。


论文介绍:本文解决了从描述复杂动态场景的单目视频中合成新视图的问题。

此前,基于时间变化的神经辐射场(也称为动态 NeRF)在这个任务上表现较好。然而,对于具有复杂物体运动和不受控制的相机轨迹的长视频来说,这些方法会产生模糊或不准确的渲染结果。

该研究提出了一种新方法,通过采用基于图像体素的渲染框架,以一种场景运动感知的方式从附近的视角中聚合特征来合成新的视角。在动态场景数据集上,DynIBaR 比现有方法取得了显著的改进。

不同方法之间的比较效果:


最佳学生论文提名

今年的最佳学生论文提名颁给了谷歌和波士顿大学的 Dreambooth。该技术在 AI 画图领域里已经很有名气,户只需提供 3~5 个样本加一句话,AI 算法就能定制照片级图像。


论文介绍:来自谷歌和波士顿大学的研究者提出了一种「个性化」的文本到图像扩散模型 DreamBooth,能够适应用户特定的图像生成需求。

该研究的目标是扩展模型的语言 - 视觉字典,使其将新词汇与用户想要生成的特定主题绑定。一旦新字典嵌入到模型中,它就可以使用这些词来合成特定主题的新颖逼真的图像,同时在不同的场景中进行情境化,保留关键识别特征,效果如下图 1 所示。

其他奖项

除了论文奖之外,大会还颁布了 PAMITC 奖,其中包括三个重要奖项,即往年设立的 Longuet-Higgins 奖、青年研究者奖,以及在 CVPR 2020 设立的 Thomas S. Huang 纪念奖。

时间检验奖

Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的「计算机视觉基础贡献奖」,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。该奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。

今年的获奖论文是 2013 年的研究《Online Object Tracking: A Benchmark》。

论文链接:https://ieeexplore.ieee.org/document/6619156

青年研究员奖

青年研究者奖(Young Researcher Awards)旨在表彰年轻的科学家,鼓励他们继续做出开创性的工作。评选标准是获奖者获得博士学位的年限少于 7 年。

今年获得该奖项的研究者是 Christoph Feichtenhofer 和 Judy Hoffman。

Thomas Huang 纪念奖

为了纪念 Thomas S. Huang(黄煦涛)教授,PAMITC 奖励委员会批准设立 Thomas S. Huang 纪念奖,以表彰在 CV 研究、教育和服务方面被公认为楷模的研究人员。该奖项从 2021 年开始颁发。获奖者需要拿到博士学位至少 7 年,最好处于职业发展中期(不超过 25 年)。

今年的获奖人是 UC 伯克利的 Alyosha Efros 教授。




参考链接:

https://twitter.com/CVPR/status/1671545306838626306

https://cvpr2023.thecvf.com/

相关文章
|
13天前
|
人工智能 自然语言处理 算法
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
近日,谷歌DeepMind团队在《自然》期刊上发表了一项名为SynthID-Text的研究成果。该方法通过引入隐形水印,为大型语言模型(LLM)生成的文本添加统计签名,从而实现AI生成文本的准确识别和追踪。SynthID-Text采用独特的Tournament采样算法,在保持文本质量的同时嵌入水印,显著提高了水印检测率。实验结果显示,该方法在多个LLM中表现出色,具有广泛的应用潜力。论文地址:https://www.nature.com/articles/s41586-024-08025-4。
50 26
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
101 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
10天前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
49 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
6天前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
46 27
|
20天前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
65 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
|
1月前
|
数据采集 人工智能 编解码
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
书生·万象InternVL 2.5是由上海AI实验室OpenGVLab团队推出的开源多模态大语言模型系列。该模型在多模态理解基准(MMMU)上表现优异,超越了许多商业模型,适用于图像和视频分析、视觉问答、文档理解和多语言处理等多个领域。
109 7
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
70 25
|
1月前
|
人工智能 vr&ar
GeneMAN:上海AI Lab联合北大等高校推出的3D人体模型创建框架
GeneMAN是由上海AI实验室、北京大学、南洋理工大学和上海交通大学联合推出的3D人体模型创建框架。该框架能够从单张图片中生成高保真度的3D人体模型,适用于多种应用场景,如虚拟试衣、游戏和娱乐、增强现实和虚拟现实等。
73 7
GeneMAN:上海AI Lab联合北大等高校推出的3D人体模型创建框架
|
2月前
|
人工智能 编解码 BI
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型,专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,在多个基准测试中表现卓越,适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。
51 2
LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型
|
4天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。

热门文章

最新文章