阿里云高校计划视觉AI五天训练营教程 Day 1

简介: 阿里云高校计划视觉AI五天训练营教程 Day 1 - 视觉生成技术(打卡:1/5)内容大纲:1. 定义和分类2. 精细理解3. 视觉生成4. 视觉编辑5. 视觉增强6. 视觉制造7. 视觉开放平台

1、视觉生产

定义

image.png

生产过程:

image.png

趋势:AI替代人工

分类:

image.png

通用基础框架:

image.png

搜索引擎生成:

直接生成困难时,寻找相似图片,整合出新的图

五个 关键维度:

保证一个较好的视觉生产效果
image.png

2、精细理解:

唯有理解(图片内容)方能生产(新的图像)
(理解是生产的前提)
(智能分割抠图->有效理解)
image.png

难度:

(实际应用图片中的)
image.png

解决思路:

分割解题思路: 在这里插入图片描述
处理透明度、边缘精细度等
过程:Mask粗分割->质量统一->估算精确alpha
实践效果:发丝级精度;(对主体)镂空细节完整;(背景与主体)复杂相似处理物体抠图拓展:动物、动画、天空……
image.png

3、从无到有:

鹿班:

视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务.

框架流程:

image.png
调查用户需求(可控性)批量产图调整

应用:电商

  • 图生图:生成一个与给出的样式图差不多的图;
  • 短视频生成:根据视频内容、语境语义、风格生成视频摘要合成/封面生成;

image.png

4、视觉编辑

移花接木

增删查改(带来更好的体验)

视频植入

image.png
增:广告插入
image.png
删:擦除
image.png
改:画幅长宽比变化+智能充填

5、视觉增强:

image.png

修旧如新高清化、人脸修复增强、渲染图、插帧、HDR色彩拓展

  • 风格迁移 (技术指向具体应用)

image.png

  • 颜色拓展

image.png

6、视觉制造 - 由虚入实

核心逻辑(实体设计制造)

image.png

服装几何生成、纹理图案迁移(3D)、视觉迁移及融合、多样性拓展、2D 3D背景融合

7、视觉开放平台

定位:

image.png

能力分布

image.png

特点

image.png

一站式能力

image.png

目录
相关文章
|
1天前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
|
1天前
|
存储 人工智能 算法
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
|
2天前
|
人工智能 运维 安全
阿里云飞天企业版“智算升级”,为政企打造AI时代最开放的云
阿里云正式发布飞天智算—飞天企业版V3.18,为政企客户打造AI时代最开放的云。此次升级,飞天企业版将智算能力深度融入云平台,实现“一云多算”,满足政企客户对云平台“云+AI”协同发展需求,为AI技术大规模在政企领域应用做好准备。
23 11
|
1天前
|
人工智能 运维 安全
阿里云通过ISO42001人工智能管理认证,引领AI治理推动协同共治
9月19日,在杭州云栖大会「AI治理与安全论坛」上,阿里云宣布通过人工智能技术的全生命周期管理ISO42001体系认证。该项认证由国际标准化组织(ISO)和国际电工委员会(IEC)制定,是第一部可认证的人工智能国际管理体系标准。
|
2天前
|
人工智能 运维 Cloud Native
专访阿里云:AI 时代服务器操作系统洗牌在即,生态合作重构未来
AI智算时代,服务器操作系统面临的挑战与机遇有哪些?
专访阿里云:AI 时代服务器操作系统洗牌在即,生态合作重构未来
|
2天前
|
存储 人工智能 数据处理
阿里云CTO周靖人:全面投入升级AI大基建
9月19日,在2024杭州云栖大会上,阿里云CTO周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。
|
2天前
|
人工智能 架构师 IDE
阿里云通义灵码重磅升级,能自主修BUG、开发应用的AI程序员来了
通义灵码AI编程能力再进化,说几句话就能开发网页
|
机器学习/深度学习 新零售 人工智能
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
在这个人工智能已经普及的时代,各行各业都充斥着AI的身影。大部分人认为人工智能起点高,入门难,想要使用AI服务又无法独立完成编写,开发者可以通过阿里云视觉平台提供的通用且标准化的接入方式,快速接入及使用阿里云视觉平台提供的包括人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目多个API能力,为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术的应用能力的综合性视觉AI能力平台。
1285 0
阿里云高校计划视觉AI五天训练营 Day 1——视觉应用探索
|
JSON 人工智能 API
阿里云高校计划视觉AI五天训练营 Day5
关爱环境卫生,人人有责,怎么快速识别垃圾的种类扔进相应的垃圾桶中,那接下来看如何快速识别垃圾分类。
阿里云高校计划视觉AI五天训练营 Day5
|
人工智能 达摩院 文字识别
阿里云视觉智能开放平台2021首秀——趣味视觉AI训练营限时免费报名中!
趣味视觉AI训练营限时报名中!!!新功能,新算法,阿里云视觉智能开发平台产品专家带你体验视觉AI平台新能力,0代码体验AI能力,一键生成可视化AI结果。本次训练营带来更多的视觉AI应用场景,达摩院算法专家分享图像分割的算法基础知识,演示人物背景替换实现过程,体验热门算法-人物动漫化。调用视觉AI能力体验AI带来的趣味性。
阿里云视觉智能开放平台2021首秀——趣味视觉AI训练营限时免费报名中!