阿里云高校计划视觉AI五天训练营 Day01 学习笔记

简介: 看到这篇成功发送,代表着我报名成功了...

Day 01

作者:第五组 邓佳阳

打卡截图

Aliyun 打卡01.jpg

前言

第一次看到阿里云的在家实验计划是在年初,因疫情原因赋闲在家,于是本人非常兴奋的上去领(bai piao)了一个长达半年,性能还蛮不错的ECS实例。时间一转到了八月,在阿里云大学界面看到了人工智能ACA的链接由黑转橙(去年考了云计算和大数据的ACA,遂有留心),浏览之余,注意到了阿里云高校计划视觉AI五天训练营,但是在当时那个时间点报名已截止,便没有参加上,但心里还是有些许遗憾;

再然后......现在不但开发者社区发了这篇字的堆砌,而且还带上了日期和打卡,必然我也就成功加入该教程训练营啦。希望自己能在这五天好好坚持下去,技能知识有所获,坚毅品性也有所获。

学习笔记

达摩院视觉AI技术应用探索内容大纲

image-20200924132749436.png

视觉生产

整体趋势:AI替代人工

定义、生产过程

image-20200924133448070.png

分类

image-20200924133607533.png

通用基础框架

image-20200924133727554.png

五个关键维度

目的:保证一个较好的视觉生产效果

image-20200924133815309.png

精细理解

唯有理解(图片内容)方能生产(新的图像)

(理解是生产的前提)(智能分割抠图 -> 有效理解)

image-20200924133948791.png

难点(实际应用图片中)

image-20200924134011208.png

分割解题思路

image-20200924134136077.png

处理透明度、边缘精细度等
过程:Mask粗分割->质量统一->估算精确alpha
实践效果:发丝级精度;(对主体)镂空细节完整;(背景与主体)复杂相似处理物体抠图拓展:动物、动画、天空……

从无到有 视觉生成—框架流程

电商:

image-20200924134510187.png

短视频生成

根据视频内容、语境语义、风格生成视频摘要合成/封面生成

image-20200924134616200.png

视觉编辑-移花接木

增删查改(优化体验)

image-20200924134949580.png

增:广告插入

image-20200924135022576.png

删:内容擦除

image-20200924135149456.png

改:比例裁切及补充

画幅长宽比变化+智能充填

image-20200924135304646.png

视频增强

修旧如新高清化、人脸修复增强、渲染图、插帧、色彩拓展、风格迁移 (技术指向具体应用)

image-20200924135351385.png

视觉制造

由虚入实

服装几何生成、纹理图案迁移(3D)、背景融合

image-20200924135500087.png

视觉智能开放平台

Domain : vision.aliyun.com

image-20200924135547756.png
image-20200924135601923.png
image-20200924135608503.png

目录
相关文章
|
28天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
10天前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
49 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
18天前
|
人工智能 UED
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
VersaGen 是一款生成式 AI 代理,专注于文本到图像合成中的视觉控制能力,支持多种视觉控制类型,并通过优化策略提升图像生成质量和用户体验。
38 8
VersaGen:生成式 AI 代理,基于 Stable Diffusion 生成图像,专注于控制一至多个视觉主体等生成细节
|
1月前
|
存储 人工智能 安全
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
从AI换脸到篡改图像,合合信息如何提升视觉内容安全?
|
24天前
|
人工智能 API 数据库
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
Browser Use 是一款专为大语言模型设计的智能浏览器工具,支持多标签页管理、视觉识别、内容提取等功能,并能记录和重复执行特定动作,适用于多种应用场景。
308 0
Browser Use:开源 AI 浏览器助手,自动完成网页交互任务,支持多标签页管理、视觉识别和内容提取等功能
|
27天前
|
机器学习/深度学习 人工智能 安全
合合信息亮相CSIG AI可信论坛,全面拆解视觉内容安全的“终极防线”!
合合信息在CSIG AI可信论坛上,全面拆解了视觉内容安全的“终极防线”。面对AI伪造泛滥的问题,如Deepfake换脸、PS篡改等,合合信息展示了其前沿技术,包括通用PS检测系统和AIGC与换脸检测系统,有效应对视觉内容安全挑战。公司在国际赛事中屡获殊荣,并联合多方发布《文本图像篡改检测系统技术要求》,推动行业标准化发展。通过技术创新,合合信息为金融、政企等领域提供可靠保障,守护社会信任,引领视觉内容安全新方向。
38 0
|
3月前
|
机器学习/深度学习 人工智能 算法
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
NVIDIA TAO Toolkit 5.0 提供低代码框架,支持从新手到专家级别的用户快速开发视觉AI模型。新版本引入了开源架构、基于Transformer的预训练模型、AI辅助数据标注等功能,显著提升了模型开发效率和精度。TAO Toolkit 5.0 还支持多平台部署,包括GPU、CPU、MCU等,简化了模型训练和优化流程,适用于广泛的AI应用场景。
83 0
使用 NVIDIA TAO Toolkit 5.0 体验最新的视觉 AI 模型开发工作流程
|
2月前
|
机器学习/深度学习 人工智能 算法
AI赋能大学计划·大模型技术与应用实战学生训练营——吉林大学站圆满结营
10月30日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·吉林大学站圆满结营。
|
4天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
13天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
79 31

热门文章

最新文章