AI视觉训练营——第一天学习记录

简介: 1、视觉生产2、分割抠图3、视觉生成4、视觉编辑5、视觉增强6、视觉制造

一、视觉生产
1、定义

通过一个/一系列视觉过程,产出新的视觉表达


· 视觉生产,把抽象的内容通过一系列算法转变成具象的内容,如视频,图片等。
2、分类

视觉生产分为 “生成 0->1”、“拓展 1->N”、“摘要 N->1”、“升维 An->An+1” 四个过程。另外还包括 “增强变换 A->B”,”插入合成 A+B->C“,“擦除 A-B->C”。


3、通用基础框架

Request (请求):


输入: 参数,素材,草案,成品,案例


Dispatch (分发):


生产类型:调用生成,素材合成,照图生图,视频摘要,编辑变换,视觉拓展


Service (服务):


视觉生产引擎:搜索引擎( 素材,案例 )<=>生成引擎( 模型,知识 )


Response (响应):


输出:图像,视频,案例


二、分割抠图
生产必要的前置步骤

识别:辨认内容


检测:确定图中识别对象内容


分割:精确到像素,对图片内的全部内容做区分


1、分割思路

1、复杂问题拆解:粗mask+精准matting


2、丰富数据样本:设计图象mask统一模型


运用 Semantic Segmentation 技术给图片添加蒙版


Instance Segmentation 技术给蒙版划分通道,这两项合称为Mask


Image Matting 将粗分割模型与精分割网络结合,精确辨认图像


2、分割模型
分割模型.png
三、视觉生成

通过视觉生成,让智能AI服务于工作。满足照图生图,海报广告设计,自动剪辑视频的个性化需求。

1、框架流程
视觉生成框架.png
2、视频生成-框架
视频合成.png
四、视觉编辑


植入广告:在视频中插入广告且与上下文内容不冲突


分镜检测,广告位检测,广告位跟踪,遮挡检测,素材匹配,光影渲染



字母擦除,台标擦除,广告擦除,场景文字擦除,人体擦除


擦除.png



画幅变化(变化视频分辨率,变化图片尺寸,保留内容)


五、视觉增强

修复画质,人脸修复,放大小图,视频分辨率,视频补帧,HDR色彩拓展(直观上增加像素对比度),风格迁移(如帆布效果,风格化),颜色拓展(在颜色合理搭配的情况下生成多样化的配色方案)


六、视觉制造

核心逻辑


视觉生产.png


可以运用在模拟包装盒打包,生成多样化服饰等领域

目录
相关文章
|
12天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
面向AI Native应用的高效迁移学习策略
【8月更文第1天】随着人工智能技术的发展,越来越多的应用场景需要定制化的AI解决方案。然而,从零开始训练一个深度学习模型往往需要大量的标注数据和计算资源。迁移学习提供了一种有效的方法来解决这个问题,它利用预训练模型的知识,通过少量的数据就能达到很好的性能。本文将深入探讨面向AI Native应用的高效迁移学习策略,并通过实例展示如何针对具体场景进行模型微调。
180 6
面向AI Native应用的高效迁移学习策略
|
1月前
|
机器学习/深度学习 人工智能 算法
【解锁AI新纪元】深度剖析元学习meta-learning:超越监督学习的智慧飞跃,掌握学习之学习的奥秘!
【8月更文挑战第2天】【元学习meta-learning】通俗易懂讲解:解锁学习之学习的奥秘与监督学习之别
58 24
|
1月前
|
机器学习/深度学习 人工智能 监控
探索视觉AI:超越计算机视觉的边界
【8月更文挑战第20天】
42 2
|
1月前
|
人工智能
如何用AI来提高英语学习效率?
【8月更文挑战第19天】如何用AI来提高英语学习效率?
|
1月前
|
人工智能 算法
AI 0基础学习,数学名词解析
AI 0基础学习,数学名词解析
13 2
|
1月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络不再是黑魔法!Python带你一步步拆解,让AI学习看得见
【8月更文挑战第3天】神经网络,曾被视为难以触及的黑魔法,现已在Python的助力下变得平易近人。以TensorFlow或PyTorch为“魔法杖”,仅需几行Python代码即可构建强大的AI模型。从零开始,我们将教导AI识别手写数字,利用经典的MNIST数据集。通过数据加载、预处理至模型训练与评估,每个步骤都如精心编排的舞蹈般清晰可见。随着训练深入,AI逐渐学会辨认每个数字,其学习过程直观展现。这不仅揭示了神经网络的奥秘,更证明了任何人都能借助Python创造AI奇迹,共同探索未来的无限可能。
32 2
|
1月前
|
机器学习/深度学习 人工智能 TensorFlow
AI Native应用中利用联邦学习保障隐私的模型微调实践
【8月更文第2天】随着人工智能技术的发展,越来越多的应用程序开始采用AI原生(AI Native)设计思路,即从一开始就将AI作为核心功能来构建软件和服务。然而,在AI Native应用中,数据隐私和安全性是不容忽视的重要问题。联邦学习(Federated Learning, FL)作为一种新兴的技术框架,为解决这一难题提供了有力的支持。它允许在多个客户端上训练机器学习模型,而无需直接传输原始数据到中心服务器,从而保护了用户的隐私。
79 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
利用迁移学习加速AI模型训练
【7月更文第29天】迁移学习是一种强大的技术,允许我们利用已经训练好的模型在新的相关任务上进行快速学习。这种方法不仅可以显著减少训练时间和计算资源的需求,还能提高模型的准确率。本文将详细介绍如何利用迁移学习来加速AI模型的训练,并通过具体的案例研究来展示其在计算机视觉和自然语言处理领域的应用。
62 4
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
【颠覆传统】解锁记忆新姿势:多模态AI单词助记神器——让单词学习变得生动有趣,打造个性化学习新体验!
【8月更文挑战第21天】多模态AI单词助记模型融合文本、语音与图像,增强英语单词记忆效果。设计上利用多感官刺激提升信息处理与记忆效率。技术栈包括React.js前端、Node.js后端、PyTorch深度学习框架等。实现过程涵盖数据准备、前端开发、后端服务搭建、深度学习模型构建及用户反馈循环。应用显示该模型显著提高学习兴趣与记忆效率,尤其对视觉和听觉学习者有益,个性化推荐系统进一步优化学习体验。
32 0