开发者社区 > ModelScope模型即服务 > 计算机视觉 > 正文

请问“视频摘要”能力是否可以输入条件来引导摘要结果

我希望对我们生成的摘要能够受到控制,例如强调一些内容,而忽略另一些。我们有什么方法解决吗?

展开
收起
游客5xcaq2cmhsdo2 2022-10-31 10:51:40 727 0
1 条回答
写回答
取消 提交回答
  • 基于某种条件引导的视频摘要是一种十分实用的技术,一般可以输入语音或者文字等信息来引导生成的摘要结果,来满足不同用户对视频摘要的不同偏好。以美食探店的视频为示例,用户甲的关注信息可以为菜品种类的介绍,例如该店的招牌菜是炙子烤肉,如何选肉、如何腌制肉是用户甲关注的重点;而用户乙的关注信息可以为店铺的地址、环境等。后续会有自然语言引导的视频摘要模型上线。

    2022-10-31 18:06:36
    赞同 展开评论 打赏

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

相关电子书

更多
《开放搜索查询分析服务架构分享》 立即下载
140-弱监督机器学...1506573734.pdf 立即下载
数据+算法定义新世界 立即下载