ViewExtrapolator:南洋理工联合UCAS团队推出的新型视图合成方法

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 南洋理工大学与UCAS团队联合推出了一种新型视图合成方法——ViewExtrapolator。该方法基于稳定视频扩散(SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像,显著减少伪影,提升视觉质量。ViewExtrapolator具有广泛的应用前景,尤其在虚拟现实、3D内容创建、电影制作等领域。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

技术基础:基于稳定视频扩散(SVD)模型,无需微调。
主要功能:生成超出训练视图范围的新视角,减少伪影。
应用场景:广泛应用于虚拟现实、3D内容创建、电影制作等领域。

正文(附运行示例)

ViewExtrapolator 是什么

公众号: 蚝油菜花 - ViewExtrapolator

ViewExtrapolator是由南洋理工大学和UCAS研究团队共同开发的一种新型视图合成方法。它基于稳定视频扩散(Stable Video Diffusion, SVD)技术,能够在不进行微调的情况下,高效生成超出训练视图范围的新视角图像。这种方法通过重新设计SVD的去噪过程,有效优化辐射场或点云渲染中易产生伪影的视图,生成更清晰、更逼真的新视角图像。

ViewExtrapolator不仅在数据和计算上具有高效性,还能广泛应用于不同的3D渲染技术,包括从单视图或单目视频派生的点云渲染。

ViewExtrapolator 的主要功能

  • 新视角外推:生成超出训练视图范围的新视角图像,对于提供沉浸式3D体验和自由探索重建的辐射场至关重要。
  • 伪影减少:基于稳定视频扩散(SVD)的生成先验,优化由辐射场或点云渲染产生的伪影,提高合成新视角的视觉质量。
  • 数据和计算效率:作为一个无需微调SVD的推断阶段方法,在数据和计算上都很高效,让新视角外推更加实用和可访问。
  • 广泛的适用性:与不同的3D渲染方法配合使用,包括从单视图或单目视频派生的点云渲染,具有很好的通用性和适应性。

ViewExtrapolator 的技术原理

  • SVD去噪过程:基于稳定视频扩散(SVD)模型,模型基于逐步去噪高斯噪声生成视频。
  • 引导退火和重采样退火:引入引导退火和重采样退火技术,基于在去噪过程中的不同阶段应用不同程度的引导,有效地修复未见区域并提高视觉质量。
  • 多视图一致性:用SVD的多视图一致性,对辐射场或点云渲染中未观测到的部分进行自然视频细节的生成,且保留原始内容,包括相机运动和场景动态。
  • 无需训练:用SVD的生成先验进行新视角外推,在数据和计算上都很高效。
  • 3D渲染的灵活性:无论是从多视图图像生成的辐射场,还是从单视图生成的点云,ViewExtrapolator都能处理,并有效提升渲染质量。

如何运行 ViewExtrapolator

环境配置

ViewExtrapolator的代码已经在python=3.11, pytorch=2.2.0, CUDA=12.1环境下测试通过。

运行步骤

  1. 克隆仓库

    git clone https://github.com/Kunhao-Liu/ViewExtrapolator.git
    cd ViewExtrapolator
    
  2. 多视图图像的新视角外推
    请参考multiview文件夹中的教程,使用3D Gaussian Splatting进行新视角外推。

  3. 单视图或单目视频的新视角外推
    请参考monocular文件夹中的教程,使用点云进行新视角外推。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
8天前
|
人工智能 安全 数据挖掘
远离生成式AI大乱斗,SAS公司揭示亚太区千亿AI市场蓝图
远离生成式AI大乱斗,SAS公司揭示亚太区千亿AI市场蓝图
|
3月前
|
自然语言处理 数据管理 大数据
发布!首个月球专业大模型来了
在2024数博会上,中国科学院地球化学研究所与阿里云联合发布国际首个“月球科学多模态专业大模型”(简称“月球专业大模型”)。
74 9
|
6月前
|
人工智能 自然语言处理 Cloud Native
《百炼成金-大金融模型新篇章》––01.大模型是DT时代标志性产物
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
|
7月前
|
人工智能 自然语言处理
浙大联合微软等提出全新视频编辑统一框架UniEdit
【2月更文挑战第13天】浙大联合微软等提出全新视频编辑统一框架UniEdit
61 2
浙大联合微软等提出全新视频编辑统一框架UniEdit
|
机器学习/深度学习 自然语言处理 达摩院
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
阿里达摩院联合上海科大、浙大和新科大将知识引入命名实体识别,摘得10个榜首
|
机器学习/深度学习 人工智能 自然语言处理
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
北大、阿里妈妈成立联合实验室,产学大牛合体,图模型、博弈论都安排上了!
|
人工智能 算法 安全
让所有人都能做蛋白质结构预测,华为昇思 MindSpore 最新成果将开源
让所有人都能做蛋白质结构预测,华为昇思 MindSpore 最新成果将开源
168 0
|
存储 机器学习/深度学习 人工智能
内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路
内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路
343 0
|
数据采集 机器学习/深度学习 人工智能
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命
国产框架MindSpore联合山水自然保护中心,寻找、保护「中华水塔」中的宝藏生命

热门文章

最新文章