中科大NDR项目原作解读:基于单目RGB-D视频的动态重建

简介: 中科大NDR项目原作解读:基于单目RGB-D视频的动态重建

基于一段单目 RGB-D 视频恢复目标动态物的几何和运动信息是计算机视觉的经典问题之一。针对该问题的解决方案在虚拟现实、增强现实等领域有着广泛的应用前景。其中以 DynamicFusion 为首的一系列动态融合算法将变形图(Deformation Graph)和截断符号距离场(TSDF)分别作为运动与几何的表征。但由于没有在一个可微的框架下将采集的颜色信息和深度信息一同表示,这类方法未能在重建阶段将颜色信息充分地利用。因此其重建的结果在保真度上依然有不小的提升空间。

为此在 NeurIPS 2022 上,中国科学技术大学等机构结合神经隐式表示提出了一个单目 RGB-D 动态重建方案 NDR。NDR 通过无模板先验的隐式形变场恢复运动信息并将观测帧的采样点变换到基准空间,再通过基准空间中的符号距离场和神经辐射场分别恢复几何与颜色信息。为了保证运动信息的周期一致性,在形变场中设计了一个符合非刚性运动的双射模块。同时,为了解决动态场景中常见的拓扑变化问题,引入了拓扑感知网络。此外,设计的 RGB-D 损失函数能确保 NDR 最终优化出高质量的几何与运动。

机器之心最新一期线上分享邀请到了中国科学技术大学 GCL 实验室三维视觉课题组博士生蔡泓锐(导师为张举勇教授),介绍神经动态重建方案 NDR。


分享主题:NDR:基于单目RGB-D视频的动态重建

分享嘉宾:蔡泓锐,中国科学技术大学 GCL 实验室三维视觉课题组在读博士生。导师为张举勇教授。本科毕业于华南理工大学数学学院。研究方向是三维数字内容的重建、理解与生成。

分享摘要:将分享在 NeurIPS 2022 上提出的一个神经动态重建方案 NDR。它是一种无模板的方法,可以基于单目 RGB-D 视频得到动态场景的高保真几何和运动信息。它能同时保证运动的周期一致性并处理拓扑变化场景。代码现已开源。

相关链接:

Neural Surface Reconstruction of Dynamic Scenes with Monocular RGB-D Camera. NeurIPS 2022.

1)SOTA!模型平台项目主页链接:

https://sota.jiqizhixin.com/project/ndr

2)论文链接:

https://arxiv.org/abs/2206.15258

3)项目主页:

https://ustc3dv.github.io/ndr/

4)开源代码仓库:

https://github.com/USTC3DV/NDR-code

相关文章
|
机器学习/深度学习 算法 PyTorch
动物姿态识别+数据集+代码
动物姿态识别+数据集+代码
|
SQL 存储 关系型数据库
如何巧用索引优化SQL语句性能?
本文从索引角度探讨了如何优化MySQL中的SQL语句性能。首先介绍了如何通过查看执行时间和执行计划定位慢SQL,并详细解析了EXPLAIN命令的各个字段含义。接着讲解了索引优化的关键点,包括聚簇索引、索引覆盖、联合索引及最左前缀原则等。最后,通过具体示例展示了索引如何提升查询速度,并提供了三层B+树的存储容量计算方法。通过这些技巧,可以帮助开发者有效提升数据库查询效率。
1208 2
|
存储 NoSQL Java
Redis如何处理Hash冲突?
在 Redis 中,哈希表是一种常见的数据结构,通常用于存储对象的属性,对于哈希表,最常遇到的是哈希冲突,那么,当 Redis遇到Hash冲突会如何处理?这篇文章,我们将详细介绍Redis如何处理哈希冲突,并探讨其性能和实现细节。
452 1
|
人工智能
SynCamMaster:快手联合浙大、清华等大学推出的多视角视频生成模型
SynCamMaster是由快手科技联合浙江大学、清华大学等机构推出的全球首个多视角视频生成模型,能够结合6自由度相机姿势,从任意视点生成开放世界视频。该模型通过增强预训练的文本到视频模型,确保不同视点的内容一致性,支持多摄像机视频生成,并在多个应用场景中展现出巨大潜力。
361 4
SynCamMaster:快手联合浙大、清华等大学推出的多视角视频生成模型
|
移动开发 监控 数据可视化
组态软件之万维组态介绍(web组态、html组态、vue2/vue3组态)
组态软件之万维组态、web组态、html组态、vue2/vue3组态,组态在工业自动化领域越来越重要,但由于市面上组态软件费用昂贵、集成复杂,使用技术门槛高,万维组态就应运而生;万维组态是一款功能强大的基于Web的可视化组态编辑器,采用标准HTML5技术,使用Vue2和Vue3语言,基于B/S架构进行开发,支持WEB端显示;支持快速集成,集成简单方便;支持在浏览器端完成便捷的人机交互,简单的拖拽即可完成可视化页面的设计;可快速构建和部署可扩展的SCADA、HMI、仪表板或LoT系统;
组态软件之万维组态介绍(web组态、html组态、vue2/vue3组态)
|
机器学习/深度学习 存储 数据采集
强化学习系列:A3C算法解析
【7月更文挑战第13天】A3C算法作为一种高效且广泛应用的强化学习算法,通过结合Actor-Critic结构和异步训练的思想,实现了在复杂环境下的高效学习和优化策略的能力。其并行化的训练方式和优势函数的引入,使得A3C算法在解决大规模连续动作空间和高维状态空间的问题上表现优异。未来,随着技术的不断发展,A3C算法有望在更多领域发挥重要作用,推动强化学习技术的进一步发展。
1106 9
|
传感器 编解码 算法
Open3D Surface reconstruction 表面重建
Open3D Surface reconstruction 表面重建
812 4
|
SQL 存储 分布式计算
MaxCompute 入门:大数据处理的第一步
【8月更文第31天】在当今数字化转型的时代,企业和组织每天都在产生大量的数据。有效地管理和分析这些数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个用于处理海量数据的大规模分布式计算服务。它提供了强大的存储能力以及丰富的数据处理功能,让开发者能够快速构建数据仓库、实时报表系统、数据挖掘等应用。本文将介绍 MaxCompute 的基本概念、架构,并演示如何开始使用这一大数据处理平台。
2069 0
|
消息中间件 NoSQL Java
Java必备面试题(100题)-八股篇
主要包括一些高频的Java面试的八股文面试题和答案

热门文章

最新文章