一、视觉生产的定义
通过一个/一系列视觉过程,产出新的视觉表达。
产出新的,和输入不一样的人或机器能够感知的图像视频,而不是标签或特征。
二、视觉生产的分类
三、视觉生产通用基础框架
有请求,分发,服务,相应四大部分,基本框架如图
四、视觉生产的五个关键维度
带来用户/商业价值(可用)
提供用户预期的抓手(可控)
保证结果的丰富性(多样)
合乎语义/内容逻辑(合理)
满足视觉/美学表现(可看)
为一个金字塔式由下至上
五、精细理解,分割抠图
识别:知道是什么
检测:识别+知道在哪儿
分割:识别+检测+每一个像素是什么
六、模型框架,解题思路
六、视觉生成框架流程
其大概过程包括理需求、定草图、选状态、调细节、生成图、评好坏 6 个步骤
七、视觉编辑
有视频植入,视频内容擦除,画幅变化,图像尺寸变化与修旧如新
视频植入:视频植入就是在视频中加入一些本来没有的内容
视觉内容擦除:要从视频中擦除一些东西(精确)
画幅变化:变化之后为了有完整的视觉效果,进行内容补全
图像尺寸变化:图像尺寸的自动变化,方便应用于其他场景中
修旧如新:视觉增强就是对视频的内容进行一些改变,以达到视频某些方面的改善效果。
八、视觉增强(分辨率、帧率、色彩)
人脸修复增强、渲染图超分、视频超分、插帧、HDR色彩扩展、风格迁移
九、视觉制造
实体设计制造、服装几何生成、多样性拓展等
总结:通过今天的学习,我学习到AI视觉的很多定义与相应的应用实例,了解了AI视觉的学习需要大量的数据训练、精确的模型识别。