阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

本文涉及的产品
视觉智能开放平台,视频资源包5000点
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
简介: 第一天的内容主要介绍了视觉生产技术的概念以及阿里的视觉智能开放平台。展示了一系列通过人工智能生成的视觉产品。通过AI算法,实现了视觉产品的从无到有,由虚入实,增删改查。感受到了人工智能给视觉生产带来的快捷和便利。

阿里云高校计划视觉AI五天训练营 Day1 视觉生产技术简介

1.视觉生产定义和分类

视觉生产的定义:通过一个/一系列视觉过程,产生新的视觉表达。

截屏2020-10-30 下午3.24.03.png

视觉生产的分类:

  • 生产: 从0到1
  • 拓展:从1到N
  • 摘要:从N到1
  • 升维:从An到An+1 (比如从二维到三维,从图片到视频)
  • 增强/变换: 从A到B
  • 插入/合成:A+B=C
  • 擦除:C-A=B

视觉生产通用基础框架:

截屏2020-10-30 下午5.11.23.png

视觉生产的五个关键维度:

  1. 可看 满足视觉/美学表现
  2. 合理 合乎语义/内容逻辑
  3. 多样 保证结果的丰富性
  4. 可控 提供用户预期的抓手
  5. 可用 带来用户/商业的价值

2.精细理解

精细理解——分割抠图

1.识别:通过AI人工智能识别画面中所描述的是什么。是人?是物?

2.检测:识别画面中的场景在哪?

3.分割:识别+检测,精准的分别物和场景,知道每一个像素是什么。

分割抠图——难点

  • 复杂背景
  • 遮挡
  • 发丝精扣
  • 边缘反色
  • 透明材质
  • 多尺度/目标

主要难点:数据严重不足,标注成本高

分割抠图——模型框架

截屏2020-10-30 下午5.28.34.png

3.视觉生成——从无到有

鹿班的框架流程(平面图片生产)

截屏2020-10-30 下午5.34.51.png

alibabawood框架流程(视频生成)

截屏2020-10-30 下午5.38.27.png

4.视频编辑——移花接木

视频内容植入

截屏2020-10-30 下午5.40.06.png

技术难点:在不干扰原本所表达内容的情况下合理的插入广告。

视频内容的擦除

截屏2020-10-30 下午5.48.28.png

视频画幅的变换

截屏2020-10-30 下午6.02.01.png

视觉增强——视频增强

截屏2020-10-30 下午6.02.58.png

视觉增强——人脸修复增强

精细化的修复人像,还原面部细节

截屏2020-10-30 下午6.16.32.png

5.视觉制造——由虚入实

目前实体制造产业所面临的问题:

1.效率低下:多次打样,多次沟通

2.协同差:设计,营销,产生脱节

3.定制难:无法实现柔性生产

核心逻辑

截屏2020-10-30 下午6.24.42.png

6.视觉智能开放平台

截屏2020-10-30 下午6.27.29.png

7.总结心得

第一天的内容主要介绍了视觉生产技术的概念以及阿里的视觉智能开放平台。展示了一系列通过人工智能生成的视觉产品。通过AI算法,实现了视觉产品的从无到有,由虚入实,增删改查。感受到了人工智能给视觉生产带来的快捷和便利。

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
探索视觉AI:超越计算机视觉的边界
【8月更文挑战第20天】
42 2
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
"揭秘AI绘画魔法:一键生成梦幻图像,稳定扩散模型带你开启视觉奇迹之旅!"
【8月更文挑战第21天】稳定扩散(Stable Diffusion)是基于深度学习的模型,能根据文本生成高质量图像,在AI领域备受瞩目,革新了创意产业。本文介绍稳定扩散模型原理及使用步骤:环境搭建需Python与PyTorch;获取并加载预训练模型;定义文本描述后编码成向量输入模型生成图像。此外,还可调整参数定制图像风格,或使用特定数据集进行微调。掌握这项技术将极大提升创意表现力。
31 0
|
1月前
|
机器学习/深度学习 人工智能 算法
【机器学习】基于YOLOv10实现你的第一个视觉AI大模型
【机器学习】基于YOLOv10实现你的第一个视觉AI大模型
85 0
|
机器学习/深度学习 新零售 人工智能
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力,为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
1285 0
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
|
JSON 人工智能 API
阿里云高校计划视觉AI五天训练营 Day5
关爱环境卫生,人人有责,怎么快速识别垃圾的种类扔进相应的垃圾桶中,那接下来看如何快速识别垃圾分类。
阿里云高校计划视觉AI五天训练营 Day5
|
人工智能 前端开发 算法
视觉AI五天训练营教程 Day 3
简介: 在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,阿里云视觉平台是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力。本期直播将带你
562 0
视觉AI五天训练营教程 Day 3
|
编解码 人工智能 文字识别
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统
本文介绍了如何使用阿里云视觉智能开放平台相关服务的PHP SDK,具体包括SDK的获取和安装方法以及SDK代码示例。
456 0
阿里云高校计划视觉AI五天训练营 Day 2——身份证识别系统
|
人工智能
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
实战讲述如何使用阿里云视觉平台API快速开发在线视觉AI平台,主要如何为如何搭建身份证识别系统,进而扩展到其他的识别系统。
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
|
人工智能 文字识别 前端开发
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
本篇文章是基于阿里云高校计划AI课程第二讲,身份证识别系统搭建。在阿里云视觉开放平台上已有调试功能。
293 0
阿里云高校计划视觉AI五天训练营教程 Day 2 - 身份证识别系统搭建
|
人工智能 智能设计 搜索推荐
阿里云高校计划视觉AI五天训练营教程 Day 1
阿里云高校计划视觉AI五天训练营教程 Day 1 - 视觉生成技术 (打卡:1/5) 内容大纲: 1. 定义和分类 2. 精细理解 3. 视觉生成 4. 视觉编辑 5. 视觉增强 6. 视觉制造 7. 视觉开放平台
612 0
阿里云高校计划视觉AI五天训练营教程 Day 1