Geoffrey Hinton再出神作：通过神经网络估计有关节可变形的三维模型-阿里云开发者社区

Geoffrey Hinton再出神作：通过神经网络估计有关节可变形的三维模型

2022-01-07 199

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Geoffrey Hinton是深度学习的创始人之一、图灵奖得主，他总以超前的思想引领着深度学习领域的发展与变革。近日，这位“深度学习之父”与团队成员再出神作，提出了利用神经网络对有关节、可变形的三维模型进行估计的方法。

微信图片_20220107205041.jpg

该论文的作者是：Timothy Jeruzalski、Boyang Deng、Mohammad Norouzi、JP Lewis、Geoffrey Hinton、Andrea Tagliasacchi。

微信图片_20220107205038.png

论文链接：https://arxiv.org/abs/1912.03207

前言

本文对《NASA: Neural Articulated Shape Approximation》进行解读，这篇文章提出了利用神经网络对有关节、可变形的三维模型进行估计的方法，与传统方法相比，NASA具有复杂度低、模型水密性好、分辨率高、模型估计效果好等优势。

简介

随着深度学习在计算机视觉以及图形学领域起到了越来越重要的作用，越来越多的方法基于神经网路模型建立了对三维几何模型的表达。然而，这些工作主要基于普通的不可变形的三维模型，对具有关节结构的可变形的三维模型的研究依然很少。但由于具有关节结构的三维模型包含了人体模型，广泛应用于游戏、电影、虚拟现实以及增强现实等领域，因此对于这类模型的研究便十分重要。

在本文中，作者提出了一种新的方法用于训练解码器D来估计有关节的三维模型，解码器生成的三维模型通过指示函数（indicator function）来表示，这一指示函数以三维模型的姿态作为参数，输入为三维空间中的点x，当该点位于三维模型内时，输出为1；位于三维模型外时，输出为0。与其他方法不同的是，NASA专注于通过姿态参数来估计三维模型的指示函数，这些姿态参数描述了三维模型是如何变形的。

这篇论文的贡献在于：

1.提出了一种通过神经网络估计有关节可变形的三维模型的方法；

2.通过明确地在网络中表示模型的变形结构，利用更少的模型参数实现了与之前方法相比相似的性能和更好的泛化能力；

3.指示函数这一表示方式支持交集和碰撞查询，无需再将其转换为其他的三维模型表示方式；

4.模型结果与之前的方法相比能够更好地学习三维人体模型的动作。

微信图片_20220107205036.jpg

图1：NASA模型生成效果（来源【7】）

NASA模型介绍

微信图片_20220107205033.jpg

1.非结构化模型（Unstructured model – “U”）

微信图片_20220107205031.png

2.分片刚体模型（Piecewise rigid model – “R”）

微信图片_20220107205029.png

3.分片可变形模型（Piecewise deformable model – “D”）

微信图片_20220107205027.png

4.实现细节

微信图片_20220107205025.png

实验结果

模型效果在2D以及3D数据集上分别进行了测试，模型的表现通过预测结果与ground-truth之间的交并比来评测。

1.二维数据

二维数据集包含了100组动作，在这一数据集几何形状的生成通过两种方式：①对于刚性数据集，包含了一组形状的集合，每个形状对应了模型的每个骨架，在整个模型的姿态发生变化的过程中，每个单独的形状不会发生变化。②对于混合数据集，则通过LBS算法得到变形的形状。对二维数据集的实验结果如下图所示：

微信图片_20220107205022.png

图3：二维数据估计效果（来源：【7】）

微信图片_20220107205020.png

图4：分片刚体模型R估计效果（来源：【7】）

微信图片_20220107205018.png

图5：分片可变形模型D估计效果（来源：【7】）

可以看到，对于训练集，三种方法都拟合出了较为不错的效果，对于结构化的两种方法，由于“D”并没有限制每一个part不能改变形状，因此“D”相较于“R”在LBS数据集上具有更好的效果。但是，“U”与“D”都有过拟合的现象产生，只有“R”在测试集上依然表现出了不错的效果。

微信图片_20220107205015.jpg

图6：在测试集上的效果（来源：【7】）

2.三维数据

对于三维模型的测试在AMASS数据集【6】上实现，实验结果如下所示，与二维数据的结果类似：

微信图片_20220107205012.png

微信图片_20220107204955.png

图7：在三维数据集上的效果（来源：【7】）

总结

本文提出了一种新的思路，利用深度学习的方法，通过模型的姿态参数来估计有关节可变形的三维模型，并比较了结构化模型（R, D）相较于非结构化模型（U）具有更高的效率以及更好的泛化能力。这一方法的提出对表示复杂的有关节模型例如人体具有重要意义。

未来方向：

1.“R”相较于“D”在实验中展示出了更好的泛化能力，但“D”在一些场景下依然具有较高的利用价值，是否可以将这两种模型进行结合；

2.对于可变形模型来说，是否可以学习到模型的微信图片_20220107205348.jpg

3.是否可以用符号距离函数来代替当前的指示函数；4.NASA是否可用于differentiable rendering；5.可变形的三维模型的运动的表示方式是否可以只通过二维信息来获取。

参考文献：

【1】Alec Jacobson, Zhigang Deng, Ladislav Kavan, and J.P.Lewis. Skinning: Real-time shape deformation. In ACMSIGGRAPH Courses, 2014.

【2】J. P. Lewis, Matt Cordner, and Nickson Fong. Pose spacedeformation: A unified approach to shape interpolation andskeleton-driven deformation. In Proceedings of the 27^thAnnual Conference on Computer Graphics and InteractiveTechniques, SIGGRAPH ’00, pages 165–172, New York,NY, USA, 2000. ACM Press/Addison-Wesley PublishingCo.

【3】Dominik Lorenz, Leonard Bereska, Timo Milbich, andBjÃ˝urn Ommer. Unsupervised part-based disentangling ofobject shape and appearance. arXiv:1903.06946, 2019.

【4】Lin Gao, Jie Yang, Tong Wu, Yu-Jie Yuan, Hongbo Fu, YuKun Lai, and Hao Zhang. Sdm-net: deep generative networkfor structured deformable mesh. ACM TOG, 2019.

【5】Jeong Joon Park, Peter Florence, Julian Straub, RichardNewcombe, and Steven Lovegrove. DeepSDF: Learningcontinuous signed distance functions for shape representation. CVPR, 2019.

【6】Naureen Mahmood, Nima Ghorbani, Nikolaus F Troje, Gerard Pons-Moll, and Michael J Black. Amass: Archive ofmotion capture as surface shapes. ICCV, 2019.

【7】Jeruzalski, T., Deng, B., Norouzi, M., Lewis, J. P., Hinton, G., & Tagliasacchi, A. (2019). NASA: Neural Articulated Shape Approximation. arXiv preprint arXiv:1912.03207.

Geoffrey Hinton再出神作：通过神经网络估计有关节可变形的三维模型

前言

简介

相关工作

NASA模型介绍

实验结果

参考文献：

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Geoffrey Hinton再出神作：通过神经网络估计有关节可变形的三维模型

前言

简介

相关工作

NASA模型介绍

实验结果

参考文献：

新智元

热门文章

最新文章

相关课程

相关电子书

相关实验场景