热门
为何生成的视频只有2s,能指定时间嘛
你要知道,一秒目前大概是16帧左右,两秒就要生成32张图片。猜测训练的时候由于计算机计算资源的限制,训练场景可能就是2s左右。不过目前有其他方案利用自回归的能力,不断输入下一个Prompt来生成一个story的视频,可达2min
包含图像描述、文本生成图片、版面分析、多模态表征、视觉问答、文档理解等多个领域