论文介绍:三维点云配准 (PCR) 是计算机视觉中的一个基本问题,目的是寻找点云对对齐的最优姿态。
该研究提出了一种基于最大团(maximal cliques,MAC)的 3D 配准方法。关键创新是放宽了对先前最大团的约束,并在图中挖掘更多的局部一致性信息,以生成准确的位姿假设。
研究者在对 U3M、3DMatch、3DLoMatch 和 KITTI 进行了大量的实验后证明,MAC 有效地提高了配准的准确性,优于各种最先进的方法,并提升了深度学习(deep-learned)方法的性能。MAC 与深度学习方法的结合在 3DMatch 和 3DLoMatch 上实现了 95.7% / 78.9% 的配准召回率,达到了最先进的水平。
1)构建兼容性图以呈现初始对应关系之间的关联关系。
在一个低重叠的点云对上,最大团( maximal )和最大限度(maximum)团之间的比较
MAC 在技术上非常简单,Pipeline 如图所示。
最佳论文提名
最佳论文提名颁给了谷歌和康奈尔大学的《DynIBaR: Neural Dynamic Image-Based Rendering》。
论文介绍:本文解决了从描述复杂动态场景的单目视频中合成新视图的问题。
此前,基于时间变化的神经辐射场(也称为动态 NeRF)在这个任务上表现较好。然而,对于具有复杂物体运动和不受控制的相机轨迹的长视频来说,这些方法会产生模糊或不准确的渲染结果。
该研究提出了一种新方法,通过采用基于图像体素的渲染框架,以一种场景运动感知的方式从附近的视角中聚合特征来合成新的视角。在动态场景数据集上,DynIBaR 比现有方法取得了显著的改进。
不同方法之间的比较效果:
最佳学生论文提名
今年的最佳学生论文提名颁给了谷歌和波士顿大学的 Dreambooth。该技术在 AI 画图领域里已经很有名气,户只需提供 3~5 个样本加一句话,AI 算法就能定制照片级图像。
- 论文地址:https://arxiv.org/pdf/2208.12242.pdf
- 项目地址:https://github.com/XavierXiao/Dreambooth-Stable-Diffusion
论文介绍:来自谷歌和波士顿大学的研究者提出了一种「个性化」的文本到图像扩散模型 DreamBooth,能够适应用户特定的图像生成需求。
该研究的目标是扩展模型的语言 - 视觉字典,使其将新词汇与用户想要生成的特定主题绑定。一旦新字典嵌入到模型中,它就可以使用这些词来合成特定主题的新颖逼真的图像,同时在不同的场景中进行情境化,保留关键识别特征,效果如下图 1 所示。
其他奖项
除了论文奖之外,大会还颁布了 PAMITC 奖,其中包括三个重要奖项,即往年设立的 Longuet-Higgins 奖、青年研究者奖,以及在 CVPR 2020 设立的 Thomas S. Huang 纪念奖。
时间检验奖
Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的「计算机视觉基础贡献奖」,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。该奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。
今年的获奖论文是 2013 年的研究《Online Object Tracking: A Benchmark》。
论文链接:https://ieeexplore.ieee.org/document/6619156
青年研究员奖
青年研究者奖(Young Researcher Awards)旨在表彰年轻的科学家,鼓励他们继续做出开创性的工作。评选标准是获奖者获得博士学位的年限少于 7 年。
今年获得该奖项的研究者是 Christoph Feichtenhofer 和 Judy Hoffman。
Thomas Huang 纪念奖
为了纪念 Thomas S. Huang(黄煦涛)教授,PAMITC 奖励委员会批准设立 Thomas S. Huang 纪念奖,以表彰在 CV 研究、教育和服务方面被公认为楷模的研究人员。该奖项从 2021 年开始颁发。获奖者需要拿到博士学位至少 7 年,最好处于职业发展中期(不超过 25 年)。
今年的获奖人是 UC 伯克利的 Alyosha Efros 教授。
参考链接: