6年前布局,如今阿里智能语音成行业第一,我们的快递、客服都离不开它

简介: 2014年,阿里巴巴悄悄启动了智能语音项目,6年过去了,它长大成了国内第一。国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,其中语音AI在智能语音、对话式AI两个领域拿下市场份额第一,市占率分别为44%和57%。

“您的包裹在菜鸟智能柜仍未提取,取件码XXX,请尽快取出。”对于忙碌的都市人来说,手机上的快递信息提供了很多便捷。

很多人不知道的是,快递派送之前打来的电话,派送的快递柜信息等,都离不开阿里云语音AI。
1.jpeg

2014年,阿里巴巴悄悄启动了智能语音项目,6年过去了,它长大成了国内第一。国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,其中语音AI在智能语音、对话式AI两个领域拿下市场份额第一,市占率分别为44%和57%。

从服务阿里经济体到服务百业,阿里语音成黑马

如果你家里突然断电,你拨打电力抢修电话,去年之前,经常电话占线中,很难打通。但电力抢修电话,今年突然变得亲民起来了,一拨就通。这离不开全国首个虚拟人工智能配网调度员帕奇的功劳。

去年,帕奇在杭州上线,它的大脑里存储着调度规程、安全规程、分析报告等数十万字的文本材料,还有上百TB(太字节)的设备、人员、电网拓扑等基础数据,5000小时语音数据,它利用知识图谱技术加工和存储这些知识,形成自己的判断和理解,最终替代人工实施配网调度。帕奇最多可以同时拨打200个电话,可以24小时不间断工作,并准确无误地完成海量数据的监视工作。

当帕奇发现电网故障时,它会第一时间发出故障警告,电话联系相关抢修专家,并准确计算出抢修专家到达抢修现场所需要的时间、导航路径等。

帕奇上岗前,配网调度员每天需要接通100多个电话,通话超过200分钟,实时监控500条信息,配调早晚高峰期的电话同时呼入量高达40次,根本来不及接通,现场人员需要长时间等待。智能调度员大大提高了调度效率,传统的电力调度工作,帕奇轻而易举就能完成。如今,现场人员的等待时间已经缩短至1分钟。
2.jpeg

帕奇的语音技术就来自于达摩院语音实验室。帕奇能听懂工作人员打来的电话,自行组织语言与对方交流,进行多轮人机对话,它还会说杭州话、萧山话。

未来,像帕奇一样的电力大脑能替代配网生产指挥领域50%以上的人力工作。以杭州为例,可减少配网调度、抢修指挥客服等200人以上,每年节约人力成本超3000万元。

阿里语音AI服务于全国近千个客服中心系统,助力近百家生态合作伙伴智能客服解决方案,让全国近亿用户体验到阿里智能语音的强大能力。

阿里语音技术来自达摩院,2014年,阿里成立了达摩院的前身iDST,最初的服务对象是阿里经济体内部的诉求。“语音技术最开始一展身手的场所就是客服呼叫中心,淘宝客服、阿里集团、蚂蚁集团、钉钉、高德等这些传统的客服呼叫中心,都进行了语音智能化改造。”阿里云达摩院语音AI专家鄢志杰告诉记者,以语音帮助阿里经济体内部业务取得了很大成功,例如,今年疫情期间大火的钉钉也由达摩院提供技术支持的,用户在钉钉发语音,接收的人瞬间就能看到文字信息,这种顺滑的语音转文字体验,幕后英雄之一就是达摩院先进的语音识别技术。

3.jpeg

把客户的命交还给客户,阿里语音靠两大绝招找到市场钥匙

你家中天猫精灵陈乔恩、许魏洲、朱正廷、哆啦A梦的声音是怎么来的?原来是阿里语音AI学习了明星不到半小时的录音语料,就“变”出来的。

只要一个明星的少量已有声音语料,阿里语音AI就可以学得惟妙惟肖。如果普通人想用自己的声音定制一个语音AI,只要按照要求录二十句话,也会自动生成你自己的伴读声音。

自2017年开始,阿里的智能AI技术开始对外输出。“我们有个口号叫达摩院技术零时差上云。阿里用到所有的好的语音技术,都会以最短的时间通过云的方式,向阿里云上所有的客户提供,零时差就代表了一种态度,这个技术不是说只有阿里能用,大家也都能用。另外,我们还会去关注这个技术如何能够商业化,能够产生客户价值。”鄢志杰表示,与传统语音技术厂商“自产、自销”模式不同,阿里云采用了被集成、自学习全新服务模式,迅速打开了市场。
4.jpeg

原来主要服务阿里经济体的语音AI,刚开始做市场推广时,有点不适应。“原来在阿里内部做的时候,各个部门都可以互相补位。但外面行业客户就不存在补位的可能。” 鄢志杰说,他们在摸索的过程中,很快调整了打法。

以语音AI的细分应用场景之一的法院为例,传统的语音AI厂商,基本任务就是把整个庭审的过程转换成文字,变得结构化,有利于后面的判决等应用。阿里的智能AI开始也想这么干,但他们很快发现了问题所在。

“首先是地域广,中国有很多的省份,有一些口音、方言的问题。同时,非AI的成分在这个场景里面也不少,怎么能做一个法官办案系统、法院卷宗管理的系统,开庭时展示在屏幕上内容的应用系统等。我们创建了被集成的模式。简单的说,我们只做最擅长的语音AI内容,其他的非AI内容,交给司法领域的一些头部的集成商,比如说让像华宇、云嘉这样子的公司来集成我们,然后做出一个法院综合的应用系统。”鄢志杰说,这种轻资产模式迅速打开了市场。

阿里语音能力覆盖政务的40余个场景,其中智能庭审语音识别覆盖超过全国20个省的8000间线下法院,覆盖率近50%。互联网庭审覆盖15000余间线上法庭,覆盖率超过90%。阿里和超过20个政务生态合作伙伴都达成了合作。目前在呼叫中心、电信运营商、法庭庭审三类场景中,阿里语音AI拥有排名第一的客户认知度。

自2017年开始,阿里语音开始进行自学习的升级。“我们发现除了开箱即用的基本通用模型外,很多客户还需要根据行业数据和知识做个性化定制。我们突然之间发现都光靠我们自己吭哧吭哧去做,不具备复制性和推广性。原因是我们不可能在每个领域都铺下这么多人力、物力来做。同时,我们来做也并非是最专业的。转换一个思路,我们通过推出自学习的产品,能把语音AI定制能力赋予行业里的实践者,在他没有很多语音领域专业知识的情况下,能够简单易用地使用我们自学习的产品,在安全环境下灌注行业里的数据和知识,就能够达到在他的行业里,世界上顶尖的语音交互的效果。有了这个自学习能力,等于充分释放了生产力。”鄢志杰说,阿里云在2017年上线了语音自学习平台,开放AI定制能力,授人以渔,帮助用户自主定制语音AI。目前,阿里云的客户和合作伙伴已在该平台开发3万多个模型。

5.jpeg

阿里云的语音自学习平台提供了一套针对声学模型和语言学模型的定制训练流程,能让用户在安全环境中灌注行业数据,在用户完全不了解语音语言算法的情况下,快速、便捷地定制自己的语音模型。在中国移动项目中,基于阿里语音自学习平台,合作伙伴仅用短短两周、数十小时数据,便将湖北、福建两省识别率优化至92%以上;在杭州虚拟人工智能配网调度员项目中,合作伙伴使用自学习平台,成功地将识别率从76%提升到93%;疫情期间,湖北的智能疫情机器人使用阿里语音AI自学习平台,湖北口音语音识别率从62.5%提升至94.4%;某合作伙伴使用自学习平台在一个月之内从无到有打造了全新的俄罗斯语和阿拉伯语语音识别模型,识别率均超过85%。

“在传统的语音技术服务模式下,客户如果有语音优化需求,需要跟技术方不停打磨,甚至需要把行业数据交给语音技术提供商。有了自学习平台,用户完全可以自己构建模型,真正把命掌握在了自己手里。” 鄢志杰表示,阿里云不会触碰客户数据,客户数据隐私绝对安全。

目前,阿里语音AI已经拥有5万多家客户,包括阿里经济体内部客户如淘宝客服、天猫精灵、高德地图、菜鸟物流助手等。在阿里经济体外部,阿里云语音AI技术已经应用于招商银行、广发银行、浙江高院、中国移动、中央电视台、华宇、字节跳动、海尔、康佳、滴滴、新浪微博、趣头条、海底捞、惠普、vipkid、上海地铁、小i机器人、丁香医生、喜马拉雅、掌阅等多个客户,覆盖教育、金融、互联网、家电、出行、传媒、交通、餐饮、通信、医疗等各行各业。

**今年中国云上人工智能市场近20亿美元,阿里云占44%份额
**
国际权威调研机构IDC公布《中国AI云服务市场半年度研究报告》,阿里云云上AI表现出色,在智能语音、对话式AI、机器学习三大领域获得6个维度第一,以44%、57%、29%的市占率位列三大领域市场份额第一,超过百度云、腾讯云、华为云、AWS、微软Azure等云服务厂商。
6.png

IDC报告调研了国内主要云厂商的云上AI服务,领域涵盖人脸人体、图像视频、智能语音(ASR&TTS)、对话式AI、NLP、机器学习六类。阿里AI获得智能语音领域产品数量、市场份额、API调用量三项第一,对话式AI领域市场份额、API调用量两项第一,机器学习领域获得市场份额第一。

2月28日,阿里巴巴语音AI技术成功入选MIT2019年“全球十大突破性技术”。MIT认为,阿里巴巴已拥有比谷歌更好的AI语音技术,可以完成复杂的人类对话功能,甚至可读懂人类的潜在意图。阿里巴巴也是唯一上榜的中国科技公司。

“通常一个行业五年复合增长率达到百分之五六十,已经是一个非常高潜力的市场了。AI云服务市场绝对是一片蓝海。” IDC分析师卢言霞表示,中国AI云服务市场的增长,从2018年到2024年这六年的年复合增长率93.6%,这是非常高的复合增长率。
7.png

卢言霞表示,在云上语音服务厂商方面,阿里占据主导地位,2019年阿里云的语音服务大概占到44%的市场份额,接近一半的市场。“其实之前可能连我自己都没有了解到,阿里云能够在语音这块做得这么好。我们的确看到阿里云在这几年在生态合作伙伴这方面走得非常快,也聚拢了非常多的合作伙伴。”卢言霞表示,在智能云语音服务市场,以阿里云为代表的云服务厂商占据越来越重要的地位,甚至将来有可能会超过原来做本地部署的一些语音技术厂商。短期来看,在AI领域,主流趋势仍是私有化部署。但云服务、混合云的浪潮也将带动AI云服务市场的快速增长。随着技术的升级,未来3~5年,今天用户已经部署的AI产品,也有可能被新一代更智能的产品替代。

对于接下来的智能云语音市场,卢言霞认为,从技术角度,整个AI正面临很多技术突破,例如人脸、人体识别,嘈杂环境的语音交互等,未来在应用领域还会有很多技术突破。从应用来讲,目前只有20%左右场景用到了AI,未来的有非常多的应用场景有待去落地。AI智能语音除了庭审、客厅、呼叫中心等消费级产品外,未来会在会议服务、医疗诊疗记录转文字、泛工业等领域陆续落地。

“大家不妨去看看还有哪些场景是今天的技术做不了或者做不好的,而且是高价值的,这些场景都会随着技术的发展逐渐解锁。”鄢志杰说,阿里语音团队有个口号叫“无处不在的语音交互智能”。他们的梦想是,今后无论何时何地,无论是在家里、办公室、公共空间,还是在车里,所有人所在的空间当中,有一天都会有语音交互的触点或入口,可以跟人交互。

转自:https://www.thehour.cn/news/385576.html

钱江晚报·小时新闻记者 张云山

目录
相关文章
|
8月前
希望阿里的小伙伴在控制台的易用性多上点心,每次问客服好像都是外包人员,啥也不会
希望阿里的小伙伴在控制台的易用性多上点心,每次问客服好像都是外包人员,啥也不会
153 2
|
存储 消息中间件 容灾
阿里IM技术分享(八):深度解密钉钉即时消息服务DTIM的技术设计
本文是国内企业IM的事实王者钉钉首次对外深度解密其即时消息服务(即DingTalk IM,简称DTIM)的技术设计实践。
1238 0
阿里IM技术分享(八):深度解密钉钉即时消息服务DTIM的技术设计
|
存储 消息中间件 缓存
阿里IM技术分享(十):深度揭密钉钉后端架构的单元化演进之路
今天想借此文和大家分享我们在钉钉单元化架构实施过程中的心路历程和一些最佳实践。因涉及的技术和业务面太广,本文的分享无法做到面面俱到,主要是想在同路人中形成共鸣,进而能复用一些架构或子系统的设计和实现思路。
988 1
阿里IM技术分享(十):深度揭密钉钉后端架构的单元化演进之路
|
消息中间件 存储 负载均衡
阿里IM技术分享(九):深度揭密RocketMQ在钉钉IM系统中的应用实践
在钉钉的IM中,我们通过 RocketMQ实现了系统解耦、异步削峰填谷,还通过定时消息实现分布式定时任务等高级特性。同时与 RocketMQ 深入共创,不断优化解决了很多RocketMQ本身的问题,并且孵化出 POP 消费模式等新特性,使 RocketMQ 能够完美支持对性能稳定性和时延要求非常高的 IM 系统。本文将为你分享这些内容。
447 0
阿里IM技术分享(九):深度揭密RocketMQ在钉钉IM系统中的应用实践
|
存储 监控 安全
|
JSON 编解码 自然语言处理
阿里智能语音交互文档操作教程
ASR :语音识别服务,提供语音转文本服务。 TTS :文本转语音服务,提供将文本转为普通话语音的语音合成功能。 NLU :自然语言理解服务,提供自然语言处理功能。
1524 0
|
自然语言处理 双11
一对一专属客服来了!天猫双11,阿里CCO推出客户经理制
无论网购遇到什么问题,直接就能找到专属客服,并让他帮你快速解决。
一对一专属客服来了!天猫双11,阿里CCO推出客户经理制
|
新零售 人工智能 自然语言处理
“数字智能客服”走进阿里 | CIO培训班
8月13日-14日,阿里云CIO学院联合达摩院举办第31期CIO培训班,共有中国农业银行、中国工商银行、浙江民泰商业银行、宁波银行、温州银行、莱商银行、马上消费金融、中原消费金融、上投摩根基金、浙江省能源集团、正泰股份等12家企业的55位客服中心和研发主管走进阿里。
1493 0
“数字智能客服”走进阿里 | CIO培训班
|
1月前
|
机器学习/深度学习 算法 人机交互
智能语音识别技术的最新进展与未来趋势####
【10月更文挑战第21天】 在当今这个信息爆炸的时代,人机交互方式正经历着前所未有的变革。本文深入探讨了智能语音识别技术的前沿动态,从深度学习模型的创新应用到跨语言、跨领域的适应性增强,揭示了该领域如何不断突破技术壁垒,提升用户体验的真实案例与数据支撑。通过对比分析当前主流算法的性能差异,本文旨在为研究者和开发者提供一幅清晰的技术演进蓝图,同时展望了多模态融合、情感识别等新兴方向的广阔前景。 ####
227 7
|
1月前
|
机器学习/深度学习 存储 人工智能
智能语音识别技术的深度剖析与应用前景####
本文深入探讨了智能语音识别技术的技术原理、关键技术突破及广泛应用场景,通过具体实例展现了该技术如何深刻改变我们的日常生活和工作方式。文章还分析了当前面临的挑战与未来发展趋势,为读者提供了一幅全面而深入的智能语音识别技术图景。 ####