智能媒体处理使用与原理(一)|学习笔记

简介: 快速学习智能媒体处理使用与原理(一)

发者学堂课程【视频云技术入门-1024程序员节创造营公益课智能媒体处理使用与原理(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/902/detail/14336


智能媒体处理使用与原理(一)


目录

一、概念

二、视频内容理解

三、音视频智能处理

四、MPS 服务介绍

 

一、概念

1、智能生产全链路(媒体 AL 加速媒体生产)

采集●绿幕抠图●智能擦除●超分●SDR 转 HDR
编辑●智能横转竖●智能提取封面●智能字幕●智能拆条
存储●智能标签●内容安全审核●智能技检●知识图谱
管理●多模态搜索●人物搜索●素材搜索●版权水印
分发●音视频 DNA●湖源水印●直播审核●存证上链
2、视频 Al 的原理

image.png

机器学习 例如决策树 支持向量机 随机森林 人工神经网络 遗传算法

更深更大

解决图像输入问题

AL 是大数据喂出来的云和 A L 是天然的结合

3如何评价 AI 效果
典型分类问题的例子:在100个视频中找出出现过人的视频
●精度:假设找出50个,其中40个是真正有人的,那么精度=0.8
●召回率:假设100个视频中真正有人的一共有80个,找出的视频中真正有人的是40个,那么召回率=0.5

精度和召回是一对矛盾

换句话来说,现阶段 AL 还做不到完美,AL 还只能辅助视频生产,生产视频的主体还是人。

Al 如何辅助生产

示例1:

通过图片搜索所有相关视频

示例2:

智能如何辅助生产

 

二、视频内容理解

1视频标签

正向的视频内容理解,基于海量视频数据的深度学习,自动提取视频中的标签,关键词等信息

视频包括视频抽帧提取音频
视频抽帧人脸识别 场景识别 物体识别 地标识别 OCR等——视频标签
提取音频 ASR NLP——文本标签

2视频审核

负向的视频内容理解,基于海量视频数据的深度学习,帮助开发者识别内容安全风险

场景名称

描述

检测结果分类

智能鉴黄

检测是否包含色情、性感内容。

正常、色情.性感

暴恐涉政

检测是否包含暴恐或涉政类内容。

正常、血腥、爆炸烟光、特殊装東.特殊标识、武器涉政、打斗.聚众.游行、车祸现场、旗帜、地标

违规

检测是否包含广告和文字违规信息。

正常、文字含涉政内容、文字含涉黄内容、文字含辱骂内容、文字含暴恐内容、 文字含违禁内容、文字含其他垃圾内容、牛皮癣广告、含维码、含小程序码、其他广告

二维码

检测是否包含二维码或小程序码

正常、含二维码、含小程序码

不良场景

检测是否包含黑屏、黑边、昏暗画面、画中画、吸烟、等不良场景。

正常、无内容(例如黑屏、白屏) .画中画、吸烟、车内直播播

logo

检测是否包含logo信息,例如台标,商标等。

正常、含受管控的 logo.含商标

 

3、视频检索

智能标签的核心应用场景;如何搭建视频检索系统?

媒资系统导入媒资视频媒资特征入库模块,然后提交标签分析入 MPS 智能标签分析,提交 DNA 分析入 MPS 视频 DNA 检索,分析结果入库,包含:标签 标描 ASR 检索入 EIasticSearch

十年多稳态检测——检索业务层模块——结果精排模块

这个是多模态检索系统

相关文章
|
6月前
|
人工智能 边缘计算 监控
【开源视频联动物联网平台】视频AI智能分析部署方式
【开源视频联动物联网平台】视频AI智能分析部署方式
352 3
|
机器学习/深度学习 人工智能 编解码
智能媒体处理使用与原理(二)|学习笔记
快速学习智能媒体处理使用与原理(二)
134 0
|
人工智能
智能媒体处理使用技巧
智能AI与视频制作
182 0
|
机器学习/深度学习 人工智能 语音技术
视频AI,助力体育赛事转播走进智能时代
2018俄罗斯世界杯经过近20天的激战,已经进入到最关键的阶段。本次赛事除了精彩纷呈的比赛之外,还加入很多高科技的元素,例如门线、VAR技术等等。让本届世界杯成为科技含量最高的一届世界杯。
2866 0
|
人工智能 文字识别 监控
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
17253 0
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
|
人工智能 编解码 搜索推荐
视频云肖长杰:视频AI科技助力短视频生态
人工智能技术是当今炙手可热的技术领域,它在制造、家居、零售、交通、安防等行业的应用已经是大势所趋。在本月云栖Techday音视频技术沙龙中,阿里云视频云产品专家肖长杰为我们分享了一些AI技术在视频中应用的小趋势,带大家回顾了AI是如何渗透到了短视频生产中的各个环节中的。
2890 0
|
编解码
小技巧:不用任何媒体处理软件进行视频压缩
小技巧:不用任何媒体处理软件进行视频压缩
479 0
|
人工智能 云栖大会 语音技术
视频AI对话杭州云栖:新一代视频智能生产的探索与实践
在今年的杭州云栖大会AB区中庭,有一个全透明建筑备受瞩目,这就是云栖数据指挥中心。在这块大屏中的媒体中央厨房部分,正是采用了视频智能生产方案,将多模态内容理解与云导播和云剪辑相结合,使原来小时级别的视频生产降至秒级。
4087 0
视频AI对话杭州云栖:新一代视频智能生产的探索与实践
|
机器学习/深度学习 人工智能 文字识别
阿里云视频技术专家柿蒂:视频AI in传媒九大业务场景解析
人工智能视觉计算和视频融合在一起能摩擦出怎样的火花呢?柿蒂提到,如同下图所示,人工智能视觉计算可以支持直播、短视频、新闻、体育、影视等多种业务场景,可以实现目标检测识别识、片段侦测、事件识别、鉴黄涉恐、OCR等多种应用层面的功能。
7046 0
|
3月前
|
人工智能 移动开发 文字识别
视觉智能开放平台产品使用合集之如何对视频流进行实时分割背景,和替换背景
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。

热门文章

最新文章