Sora是由美国人工智能公司OpenAI在2023年2月16日发布的一款AI视频生成模型。该模型能够通过文本提示,生成逼真且富有想象力的视频。
Sora模型的最大突破在于视频时长。与之前的RunwayML、SVD只能生成4秒左右的视频片段相比,Sora模型生成的60秒视频实现了明显提升。这一突破主要归功于Sora模型所采用的Diffusion Transformer架构,该架构由Sora模型的主要作者Bill Peebles在2022年提出。
Sora模型的设计灵感来自于大语言模型,其训练过程也获得了大语言模型的灵感。Sora模型不仅展现了三维空间的连贯性、模拟数字世界的能力、长期连续性和物体持久性,还能与世界互动,如同真实存在。
此外,Sora模型还展现了对“物理规律”超强的学习能力,能够生成符合物理规律的视频内容。
总的来说,Sora技术是一种先进的AI视频生成模型,具有强大的视频生成能力和学习能力,能够生成逼真、富有想象力的视频内容。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352