语音识别:市场前景可观,但核心技术仍需突破

简介:

在CES 2017之后,语音识别成为了众人的关注焦点,而在市场规模扩大的背后,语音识别还不能完全满足人类的需求。

随着人工智能产品在生活中的渗透率越来越高,其中技术的发展也成为了众人关心的重点所在。作为人机自然交互的基本途径之一,近期以来,语音识别的发展不可谓不快速。

当下,诸如科大讯飞、百度等多家企业声称,其研发的语音识别技术已经达到了97%的准确率。而在日前,谷歌研究员公开表示其语音识别的错误率(将一个词语从语音转录成为文字时的错误率)自2012年以来已经降低了30%以上……纵观过去的2016年,谷歌、苹果和微软等多家科技巨头都公布了自己在语音识别上的进展和突破,而在接下来的时间里,语音识别也将是2017年的发展重点之一。

市场前景可观,而语音识别仍需突破

新兴产业市场广阔,推动语音识别技术发展

在刚刚过去不久的CES 2017展会上,我们见到了许多人工智能产品,要是来一场评比大赛,自动驾驶和智能家居绝对是主角。不过,再往深究,语音识别技术才是此次展会人工智能部分的“亮点”。

市场前景可观,而语音识别仍需突破

智能家居

在智能家居,不管是智能家电还是机器人,语音识别技术都是必备的基本功能之一。据知名市场调研公司《Markets And Markets》发布的调查报告称,全球智能家居市场规模将在2022年达到1220亿美元,2016-2022年年均增长率预测为14%。而在机器人方面,研究机构IDC预测,至2020年,全球机器人与相关服务市场规模将由2016年的915亿美元增至1880亿美元。从这两点数据来看,可想而知未来智能家居的市场之大。

在控制方式上,除了部分智能家电之外,语音控制已经成为了市场的主流,而这就是语音识别市场的商机。未来,作为人机自然交互的前提之一,语音识别必然是智能家居的发展趋势,只有语音识别的准确率接近完美,人机的自然交互才能继续开展。在智能家居市场的推动下,语音识别技术必将成为重点发展对象。

市场前景可观,而语音识别仍需突破

智能汽车

在CES 2017展会上,各大传统汽车制造商都带来了自己在自动驾驶汽车的最新成果。与此同时,在展会上,除了展示成果,不少厂商也宣布了自己的一系列计划,其中就包括在汽车中加入虚拟助手平台,以促进人车交互,进一步提升用户体验,比如日产、宝马与Cortana的合作,还有福特与Alexa的联手。

根据美国市场研究机构勒克斯的研究报告显示,自动驾驶汽车将在2030年创造价值870亿美元的市场。此外,另有研究显示,2030年全球范围将售出约1.2亿辆自动驾驶汽车。从数据来看,自动驾驶汽车的市场十分具有看头。

自动驾驶市场的推动下,人车交互也成了自动驾驶玩家的一个关注点,是汽车智能化的一部分。此外,相对于自动驾驶辅助技术,语音识别等交互技术的实现则容易得多,目前也已有不少车型搭载了语音识别技术。在智能汽车中,语音识别已经成为了一项基础的服务,而随着智能化时代的来临,人们对语音识别的要求也会进一步提升。

市场前景可观,而语音识别仍需突破

未来市场可观,而语音识别仍需“做事”

在新兴产业市场需求的推动下,语音识别的市场也是十分具有看头的,有研究机构指出,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元。然而,在市场规模壮大这一美好的预测面前,我们也不能忽视一些需要面对的问题,只有解决了它们,语音识别才能得到完善,给用户带来极致服务。

市场前景可观,而语音识别仍需突破

首先就是对象识别的准确性。现在,在应用上,我们看见语音识别多是在智能家居领域,包括智能家电和服务机器人。此时,我们就要考虑一个问题了,当多个家庭成员同时讲话时,智能家电和服务机器人该执行谁的命令呢?它们又如何能在众声音中找出自己主人的命令?这些都是当前语音识别所需要解决的问题,毕竟我们通常所说的语音识别不仅仅只是单纯的对语音内容进行识别。

在这个问题上,人们也找到了一个解决方案——声纹识别。一般来讲,声纹具有唯一性,对说话人身份的确认有着极大的帮助。借助于声纹识别,语音识别能够准确对说话人的位置和身份进行定位,从而准确识别语音内容,执行其中下达的指令。不过,鉴于数据的极大空缺等问题,声纹识别技术还需完善。

市场前景可观,而语音识别仍需突破

其次是降低周边环境的干扰。对于人类来讲,在嘈杂环境中听别人说话或是从众多声音中找出自己想听的内容还是一件较为简单的事,而与此相反,这件事在机器这里并没有那么容易。

为了降低周边环境对语音识别的干扰,亚马逊和谷歌都在智能音箱中使用了麦克风阵列技术,从而起到一定的“降噪”作用,增加语音识别的准确率。不过,到目前为止,环境的干扰依然没有得到更好的解决,仍然是语音识别前进道路中的一只“拦路虎”,尤其是在多段语音中准确找出指定说话人的情境中。

市场前景可观,而语音识别仍需突破

在一次采访中,人工智能和机器学习权威学者、百度首席科学家吴恩达表示,2017年是“对话式电脑”快速发展的一年。对话式电脑,诸如聊天机器人、人工智能虚拟助手之类,作为展开对话的第一步,语音识别也属于这快速发展的一部分。

智能家居智能汽车等多种产业以及聊天机器人、虚拟助手这些产品市场的推动下,语音识别的市场正在不断扩大,同时也是对它准确性的一个挑战。

2016年,在语音识别内容的准确率上,各科技企业和团队都有了相应的突破,而在接下来的一年里,如何降低周边环境的干扰以及如何提高对声音的识别准确率将是语音识别所要解决的问题。


原文发布时间: 2017-01-16 18:23
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
人工智能 前端开发 算法
【2023五福】创新科技与传统年俗的有机融合 - AI 年画
23 年兔年,五福项目将传统的写福字升级成了年画,用户通过绘制兔子轮廓可以得到活动的兔子,同时由 AI 生成对应的兔子年画,整个过程给用户带来很强的惊喜感,同时将具有传统氛围的年画与科技感拉满的 AI 作图有机结合,为大家带来全新的年俗体验。AI 年画作为 23 兔年五福的创新项目,在玩法和技术方案上都采用全新的实现,前后端技术、AI 算法深度,以及美术互动等深度协同,实现了玩法了技术的双创新,最
【2023五福】创新科技与传统年俗的有机融合 - AI 年画
|
传感器 人工智能 搜索推荐
新兴AI技术与传统体育赛事的完美结合
随着近几年人工智能技术的不断发展,AI技术已经渗透到了各个领域,其中就包括体育赛事,尤其是在竞技领域,AI也已经开始积极参与,并在某些领域超越人类。通过AI技术能够帮助各种体育运动的参赛者、观众和组织者更好地发挥和管理其资源,从而推动体育赛事的发展和进步。恰逢第19届亚运会即将在杭州开幕,那么本文就来聊聊人工智能与体育竞技的结合探讨。
457 1
新兴AI技术与传统体育赛事的完美结合
|
人工智能
人工智能(AI)行业如此烧钱,离真正商业化还有多远,如果不商业化还能走多远?
似乎在一夜之间,ChatGPT家喻户晓,成为当下最热门的话题之一,吸金无数。ChatGPT,大模型等也是最近的热门词汇。ChatGPT概念的走红,背后有相应的技术支撑和社会对人工智能的现实需求,当然这其中也少不了资本的推波助澜。但是个人觉得资本在热捧ChatGPT的同时,也应该要注意避免泡沫。
135 0
|
人工智能 编解码 自然语言处理
2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢
2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢
125 0
|
机器学习/深度学习 新零售 人工智能
软硬结合AI加持?智能硬件独角兽的求生之路
软硬结合AI加持?智能硬件独角兽的求生之路
软硬结合AI加持?智能硬件独角兽的求生之路
|
人工智能 运维 算法
迈过AI算力鸿沟,人工智能计算中心的产业价值凸显
“十四五”规划纲要将“加快数字化发展 建设数字中国”单独成篇,并首次提出数字经济核心产业增加值占GDP比重这一新经济指标,将数字经济提升到了国家战略高度,AI作为数字经济的重要驱动力之一,即将迎来重大发展机遇。
迈过AI算力鸿沟,人工智能计算中心的产业价值凸显
|
机器学习/深度学习 人工智能 算法
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
今年 7 月,在开发者大会上,百度公布了其在 AI 技术上的进展。而短短四个月后,在昨日的百度语音能力引擎论坛上,百度在语音领域再次公开了最新的算法成果。同样引人关注的还有百度鸿鹄芯片的最新进展。
447 0
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
|
机器学习/深度学习 人工智能 自然语言处理
人工智能大规模应用遇阻,多家企业推出RPA,或成AI落地最佳方式
让每个企业具备AI应用场景,RPA已成企业实现人工智能最佳捷径 人工智能大规模应用遇阻,多家AI企业推出RPA,或成AI落地最佳方式 无视企业信息化场景差异,RPA或成人工智能落地最佳方式 全文约3900字, 阅读时间约8分钟
277 0
人工智能大规模应用遇阻,多家企业推出RPA,或成AI落地最佳方式
|
人工智能 算法 Cloud Native
AI 进入工业化进程,百度要用这三大打法,加速智能革命
8 月 29 日,「ABC SUMMIT 2019 百度云智峰会」在北京国家会议中心举行。百度副总裁、智能云事业群组总经理尹世明一口气发布了 18 大智能计算新品及 7 大场景解决方案,讲述了 6 个典型客户案例,宣布成立了 1 个生态联盟。
245 0
AI 进入工业化进程,百度要用这三大打法,加速智能革命
|
人工智能 供应链 搜索推荐
【智能AI】让国货变「潮」,可持续吗?
红花油味道的国产汽水,印着麻将的国产球鞋,花露水气息的咖啡……“国潮”跨界越来越匪夷所思了。如果让你当这个媒人,还会这么来搭配吗?
596 0
【智能AI】让国货变「潮」,可持续吗?