CVPR 2024:跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式

简介: 【5月更文挑战第6天】南洋理工大学研究团队在CVPR 2024会议上提出SurMo,一种动态人体渲染新方法,能高度还原视频中的人物动作和细节,如飞扬的裙摆。SurMo通过4D运动建模,结合表面运动编码、物理运动解码和4D外观解码,实现动态图像的精确合成。尽管面临复杂动作捕捉和计算资源需求的挑战,SurMo在动态人体渲染任务上表现出色,展现了表面基运动三角平面的强大表达能力。[论文链接](https://arxiv.org/pdf/2404.01225.pdf)

在CVPR 2024会议上,南洋理工大学的研究团队提出了一种名为SurMo的新型动态人体渲染范式。该方法在动态人体渲染领域取得了显著的进展,能够高度还原出视频序列中人物的动作和外观,包括飞扬的裙摆等细节。

动态人体渲染是指根据人物的静态姿势生成对应的动态图像,这一技术在电影制作、游戏开发等领域有着广泛的应用。然而,现有的动态人体渲染方法往往只关注于单帧图像中人物外观的重建,而对人物动作的连续性和时间关系缺乏充分的探索。

为了解决这个问题,SurMo采用了一种全新的4D运动建模方法。它通过三个关键设计,实现了对人物动作和外观的联合建模:

首先,SurMo采用了基于表面的运动编码方式。它使用一种高效紧凑的表面基三角平面来描述4D人体运动。这种编码方式不仅能够在密集的表面流形上捕捉到空间和时间上的动作关系,还能够继承人体拓扑结构先验,从而在训练样本稀疏的情况下实现具有良好泛化能力的新颖视角合成。

其次,SurMo采用了物理运动解码方式。在训练阶段,它通过解码时间步t的运动三角平面特征来预测下一个时间步t+1的时空导数,从而鼓励模型学习到更符合物理规律的运动模式。

最后,SurMo采用了4D外观解码方式。它使用一种高效的体素表面条件渲染器,将运动三角平面渲染成图像。这种渲染器专注于身体表面的渲染,并利用运动学习进行条件化,从而能够生成高保真、视角一致的人体图像,甚至包括快速运动和运动依赖的阴影效果。

通过大量的实验验证,SurMo在动态人体渲染任务上取得了最先进的性能。它能够高度还原出人物的动作和外观,包括快速运动和复杂的身体姿势。此外,SurMo还展示了表面基运动三角平面在表达能力上的优越性,能够生成高质量的动态人体图像。

然而,SurMo也存在一些局限性。首先,由于它采用了基于表面的运动编码方式,对于一些复杂的人体动作,如手指的精细运动,可能无法完全捕捉到。其次,SurMo的训练和推理过程可能需要较大的计算资源,这对于一些实时应用场景可能存在挑战。

论文地址:https://arxiv.org/pdf/2404.01225.pdf

目录
相关文章
|
24天前
|
云安全 人工智能 安全
阿里云欧阳欣:AI时代下的安全新范式
2024 云栖大会技术主论坛重磅发布
668 4
阿里云欧阳欣:AI时代下的安全新范式
|
1月前
|
人工智能 自然语言处理 搜索推荐
AI战略丨SaaS 遇见 AI, 企业教培开启新范式
“我们会不断完善整体的工程能力,争取以最低的成本,帮助用户训练他们所需要的、好用的 AI 产品。”
|
22天前
|
云安全 人工智能 安全
AI时代云安全新范式,阿里云安全能力全线升级!
AI时代,云安全面临着新的挑战,不仅要持续面对以往的传统问题,更需要全新理念落地于产品设计、技术演进、架构设计,才能实现效果、性能、和成本的最优解。
67 6
|
4月前
|
人工智能 算法 计算机视觉
无论真实还是AI视频,摩斯卡都能重建恢复4D动态可渲染场景
【6月更文挑战第30天】摩斯卡系统革命性地从单视角视频重建4D动态场景,融合2D视觉模型与物理优化,实现渲染。利用“Motion Scaffold”表示几何、外观和运动,即使在多视角输入困难时也能保证高质量重建与渲染。虽有输入质量和计算资源限制,但其创新性提升了动态场景处理的实用性和可控性。[arXiv:2405.17421](https://arxiv.org/pdf/2405.17421)
51 2
|
4月前
|
SQL 人工智能 Devops
《AIGC+软件开发新范式》--01.当「软件研发」遇上 AI 大模型(1)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
162 0
|
4月前
|
人工智能 自然语言处理 IDE
《AIGC+软件开发新范式》--01.当「软件研发」遇上 AI 大模型(2)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
137 1
|
4月前
|
人工智能 运维 Devops
《AIGC+软件开发新范式》--01.当「软件研发」遇上 AI 大模型(3)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
138 1
|
4月前
|
人工智能 搜索推荐 测试技术
《AIGC+软件开发新范式》--05.阿里云首个 AI 员工入职,围观开发工程师使用反馈
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
287 1
|
4月前
|
存储 运维 安全
Greenplum闭源?平滑迁移到 AnalyticDB 开启Data+AI新范式
知名开源 MPP 数据库 Greenplum 由于其丰富的企业级特性和出色的数据处理能力成为很多企业构建数仓的首选。近期 GP 公开 Github 仓库无法访问仅保留只读归档代码,业界纷纷猜测 GP 即将闭源。云原生数仓 AnalyticDB PostgreSQL 版完全掌控内核代码,完全兼容GP语法,全自研计算及存储引擎较比开源GP有五倍性能提升,全自研企业级特性在实时计算、弹性扩展、安全增强、高可用等方面实现对GP的全面超越,并在数仓能力上扩展了向量检索及一站式 RAG 服务,帮助企业快速构建 AI 应用、开启 Data+AI 新范式。
59108 3
|
5月前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
72515 7