开发者社区 > ModelScope模型即服务 > 多模态 > 正文

text2video模型生成视频只有2s钟

为何生成的视频只有2s,能指定时间嘛

展开
收起
1634116198694012 2023-03-22 19:18:30 1596 0
1 条回答
写回答
取消 提交回答
  • 你要知道,一秒目前大概是16帧左右,两秒就要生成32张图片。猜测训练的时候由于计算机计算资源的限制,训练场景可能就是2s左右。不过目前有其他方案利用自回归的能力,不断输入下一个Prompt来生成一个story的视频,可达2min

    2023-03-28 11:20:19
    赞同 1 展开评论 打赏

包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载