展望2018:人工智能为媒体服务赋能

简介: 人工智能为多媒体服务带来了更多、更有价值的新功能,让你的媒体、你的video更加智能化,帮助用户获取更好的体验。

人工智能为多媒体服务带来了更多、更有价值的新功能,让你的媒体、你的video更加智能化,帮助用户获取更好的体验。微软大中华区创新技术合作事业部 (CSE)资深技术顾问梁建为我们分享了人工智能与媒体服务的契合以及未来的发展方向。




大家好,我是来自微软创新技术合作事业部的梁建,很高兴接受LiveVideoStack的邀请,跟大家一同介绍和畅想媒体服务video在未来2018年可能的发展。


2017年,我们经历了整个媒体行业视频服务、视频处理的快速发展,与此同时人工智能和区块链也是去年的热点话题,那我们就一起来看下人工智能和我们的媒体服务如何进行结合。  


人工智能帮助我们实现更多场景


传统的媒体服务都会做哪些事情?比如线上直播、编解码、内容保护等等的服务,但随着人工智能技术的发展,很多媒体行业或者媒体业务处理行业的朋友,也在探索如何将人工智能应用到现在的媒体技术和行业发展上,包括视频的发展上。  


大家可以思考下在哪些场景上人工智能技术能帮助我们实现更多的场景?比如如何在越来越多的视频中发现更好的、更需要的内容;如何让视频内容里人物之间产生关系;在视频编辑和处理过程中,如何增加字幕的信息以及多语言的支持;如何让视频自动的增加评论,像大家熟知的视频里中比较流行的弹幕;以及如何让视频里产生更多的价值,比如在视频里如何更好的嵌入广告,让视频自动的把对用户的洞察力、想法展现出来。  


人工智能让媒体服务更“聪明”


这里我也想跟大家介绍在微软的Azure云平台上有一个Media Services媒体服务,它不仅仅包括了传统的视频直播、Encode、Decode这种编解码能力、内容保护能力,以及多渠道、多设备的Player的能力。它还提供了Video AI的能力。也就是除了在这个传统的Midea Services架构上,我们可以能帮助大家产生支持多种设备的流媒体Streaming的格式。同时它还 提供了Media Analytics媒体分析,它能够从视频汇总产生一些洞察力,帮助大家降低人工成本,同时自动拿到更多的信息。  


在微软的Media Analytics服务中,它融入了非常丰富的人工智能技术:Audio Transcript能够通过语音视频自动生成字幕信息;通过人脸检测知道视频中出现了哪些人物;通过视频OCR把视频中非数字的信息转化为数字的文字信息;根据视频中人脸的信息,选取人物自动增加人脸修正;通过Video summaries智能生成视频的总结或片段,比如一个小时的视频生成出一分钟的预告或者介绍;Content moderation可以智能审核内容信息,比如成人信息、用暴力等等;以及通过比较流行的DNN深度学习算法、神经网络来实现物体的识别。此外还有视频的稳定、情绪识等等。由此我们可以预见在2018年,除了传统的视频编解码、视频流以及最新的视频格式外,人工智能技术会给我们产生更多的价值,同时帮助我们降低成本。除了以上介绍的10种AI服务,我们也相信在2018年微软还将提供更多的智能服务,也欢迎大家持续关注微软Azure Media Services平台。  


除了传统服务,微软还提供了五大方面29类的认知服务,而这29类服务又分别都提供了自己相关的API,它不仅可以用在传统的图片、语音识别、知识搜索,你可以非常方便地将它应用到自己的媒体服务中。特别的,我们还有一个最新的服务Video Indexer,我们前面提到的10种人工智能服务都包含其中,包括translater——无论文字或者语言的,这样对于一个视频,它就会自动根据你的需求去进行说语音识别、人脸识别、字幕翻译、多语言翻译、视频内容总结、场景分析等等。那如果你希望视频有更多的拓展,比如知识搜索就非常重要,你可以根据视频去搜索相关的视频、图片,同样的你还可以进行新闻的搜寻。


这里我们还提供了Custom Services——从视觉、到语言理解、到语音服务、到搜索都有一个定制化的体验。其实我们的API都是通用的,只不过定制化的场景、训练的数据是需要大家来提供。比如你希望在视频服务中为用户做更多的拓展搜索,但又并不希望进行全网搜索找到一些不想要的信息,那么此时你就可以利用Custom Search定义相关的网站和希望的内容,从而得到你规定的信息。语言理解上,大家可以很方便地把一些用户在视频聊天对话中,给他的关键词、用户所要的意图、定义一些场景,通过自然语义理解抽取出来。包括我们说的Custom Vision可以通过frame这种方式把视频中的一些场景、物体识别、场景给他抽取出来,让我们的视频不仅仅是传统中的观看、编码、streaming,同样的你也可以通过人工智能拿到更多的信息。  


最后,我也希望在2018年有越来越多的媒体制作、开发的合作伙伴一定将人工智能技术用起来,让你的媒体、你的video更加智能化,拿到更多的信息。同样,我相信在2018年我们和LiveVideoStack音视频技术社区会有非常多的合作,也特别希望把更多的人工智能技术、更多的Media Services的服务给大家介绍出来,帮助大家更好的工作,同时带来更多的体验。也预祝LiveVideoStack社区越办越好,吸引更多的开发者,能够汇集开发者、汇集我们这些做人工智能、做媒体服务的合作伙伴,谢谢大家!

相关文章
|
16天前
|
人工智能 自然语言处理 数据可视化
阿里云AI大模型助力客户对话分析——全方位提升服务与体验
随着数字化转型的推进,企业愈发重视客户互动数据的价值。阿里云推出了一套基于AI大模型的客户对话分析解决方案,通过自动化手段分析大量客户对话数据,提取有价值信息,优化服务流程,提升客户体验。本文将结合技术文档和实际体验,全面评测这一解决方案。
38 2
|
2月前
|
人工智能 自然语言处理 前端开发
基于ChatGPT开发人工智能服务平台
### 简介 ChatGPT 初期作为问答机器人,现已拓展出多种功能,如模拟面试及智能客服等。模拟面试功能涵盖个性化问题生成、实时反馈等;智能客服则提供全天候支持、多渠道服务等功能。借助人工智能技术,这些应用能显著提升面试准备效果及客户服务效率。 ### 智能平台的使用价值 通过自动化流程,帮助用户提升面试准备效果及提高客户服务效率。 ### 实现思路 1. **需求功能设计**:提问与接收回复。 2. **技术架构设计**:搭建整体框架。 3. **技术选型**:示例采用 `Flask + Template + HTML/CSS`。 4. **技术实现**:前端界面与后端服务实现。
59 1
|
2月前
|
SQL 人工智能 运维
在阿里云日志服务轻松落地您的AI模型服务——让您的数据更容易产生洞见和实现价值
您有大量的数据,数据的存储和管理消耗您大量的成本,您知道这些数据隐藏着巨大的价值,但是您总觉得还没有把数据的价值变现出来,对吗?来吧,我们用一系列的案例帮您轻松落地AI模型服务,实现数据价值的变现......
181 3
|
3月前
|
人工智能 自然语言处理 算法
【人工智能】探索GPT-4o mini:解锁成本效益新纪元,赋能开发创新与效率
在人工智能领域的浩瀚星空中,OpenAI再次以其创新之光照亮了前行的道路,推出了备受瞩目的GPT-4o mini模型。这款被誉为“迄今为止最具成本效益的小模型”不仅继承了GPT系列强大的自然语言处理能力,更在成本控制上实现了重大突破,为开发者们开启了一扇通往高效与创新的大门。
64 1
|
3月前
|
机器人 C# 人工智能
智能升级:WPF与人工智能的跨界合作——手把手教你集成聊天机器人,打造互动新体验与个性化服务
【8月更文挑战第31天】聊天机器人已成为现代应用的重要组成部分,提供即时响应、个性化服务及全天候支持。随着AI技术的发展,聊天机器人的功能日益强大,不仅能进行简单问答,还能实现复杂对话管理和情感分析。本文通过具体案例分析,展示了如何在WPF应用中集成聊天机器人,并通过示例代码详细说明其实现过程。使用Microsoft的Bot Framework可以轻松创建并配置聊天机器人,增强应用互动性和用户体验。首先,需在Bot Framework门户中创建机器人项目并编写逻辑。然后,在WPF应用中添加聊天界面,实现与机器人的交互。
86 0
|
4月前
|
机器学习/深度学习 人工智能 DataWorks
云上AI服务,中国最佳
云上AI服务,中国最佳
97 10
|
4月前
|
人工智能 自然语言处理 搜索推荐
人工智能:赋能开发的革命性力量
在科技飞速发展的今天,人工智能(AI)正深刻影响软件开发。AI作为强大的助手,通过自动化需求分析、智能代码补全及测试等手段大幅提升开发效率。同时,AI助力软件创新,如个性化推荐系统改善用户体验,并通过数据分析辅助决策,降低项目风险。随着AI技术普及,掌握相关技能变得至关重要,推动开发者技能升级与人才培养。总之,AI正重塑软件开发,加速流程、激发创新,引领行业发展至新高度。
137 1
|
4月前
|
人工智能 自然语言处理 机器人
客户在哪儿AI的ToB获客服务和AI外呼机器人的有何不同
客户在哪儿AI的ToB获客服务 VS AI外呼机器人的ToB获客服务。
|
4月前
|
机器学习/深度学习 人工智能 搜索推荐
人工智能在医疗领域的应用:重塑医疗服务的未来
【7月更文挑战第26天】人工智能正在深刻改变医疗领域,为医疗服务的提升和医学研究的推动注入了新的活力。随着技术的不断进步和应用范围的扩大,我们有理由相信,在不久的将来,人工智能将为我们带来更加精准、高效的医疗服务,让人类健康事业更加繁荣昌盛。作为开发者和医疗工作者,我们应当积极拥抱这一变革,共同推动人工智能在医疗领域的广泛应用和发展。
|
4月前
|
人工智能 自然语言处理 API
深度融合与创新:Open API技术促进AI服务生态构建
【7月更文第21天】在数字化转型的浪潮中,人工智能(AI)已从概念探索走向实际应用,深刻改变着各行各业。Open API(开放应用程序接口)作为连接技术与业务的桥梁,正成为推动AI服务普及和生态构建的关键力量。本文将探讨Open API技术如何通过标准化、易用性和灵活性,加速AI服务的集成与创新,构建一个更加丰富多元的AI服务生态系统。
192 2

热门文章

最新文章