2018云栖大会深圳峰会阿里云IoT物联网技术专场上,阿里云IOT事业部高级技术专家龙一民在深圳云栖大会给大家介绍了AI赋能语音交互Link Voice。从内容和智能家居生态角度阐述了Link Voice的广阔前景,着重从从前端硬件,数字信号处理,到云端数据处理详细分析了Link Voice的优势。
数十款阿里云产品限时折扣中,赶快点击这里,领券开始云上实践吧!
以下为精彩视频内容整理:
云平台简介
目前市场主流的智能语音平台为阿里云、Google、Amazon和苹果公司。Link Voice云平台是阿里云研发的智能语音平台,旨在通过阿里云平台资源帮助更多公司及用户实现智能语音交互。
我们把智能家居分为家居、家电、运动健康和汽车车载等四个场景,这些场景里面的设备都会具有语音交互能力。个人猜想扫地机器人未来除了语音交互能力之外还添加视觉采集能力,这样具备巡逻能力的设备可以帮用户观察家里房间安全、老人和儿童的位置安全等功能。同时运动健身方面智能耳机也是我们关注的一个设备,去年苹果发布了Earpods,阿里云也和侯氏联合在设计一款蓝牙耳机,在耳机里内置本地化处理、本地化唤醒等技术。去年我们也和新中心合作了车载蓝牙市场,之后发布了基于蓝牙耳机的解决方案,也是支持本地唤醒的。
Link Voice平台有两大优势,一个是内容优势,另一个是智能家居生态优势。由上左图调研报告中可以看出,大家最感兴趣的云端内容其一是智能家居控制,其二是信息获取比如音乐、电台等内容。在AliOS Things上可以找到版权超过两千万的虾米音乐,还有喜马拉雅、蜻蜓FM、贝瓦儿歌等内容合作伙伴。在智能家居生态方面,现在已经拥有超过千万台设备在阿里云上运行。通过云端系统,不仅可以让设备控制设备本身,也可以让设备控制其他设备的操作。甚至可以告诉家里的冰箱,半小时之后打算出门,请出租车停在北门这样的指令,都可以帮助用户完成。
端模块介绍
语音产品从前端硬件,到数字信号处理,到云端数据处理,其实是一个多领域交叉融合的产品。所以Link Voice把每一类问题细分并解决处理,提供给大家一站式开发能力。由上图可以看到,Link Voice在硬件方面具备多项优点,可以兼容多个操作系统,声学信号处理方面具备声源定位、回声消除、噪音消除等特点,算法方面概括多项主流操作,并且依赖于阿里云平台各项资源,具有强大竞争力。
在整个语音行业里面,Link Voice实际上是提供了很多B2B、B2C的商业模式。有很多传统家具家电行业合作厂商,会把产品进行语音化改造,经过一站式开发和平台赋能之后,最后经过验收测试,推广到应用市场上。Link Voice支持厂家或者用户可以自定义语音唤醒词,更加满足多元的用户体验。
在交互方式方面,大家可以看到最后的硬件设备分类。Push Talk就是设备上有一个按键,开始按同时识音开始,结束按识音结束。Tab Talk意思是设备上有按键,开始按同时识音开始,系统自动判别结束时间点。Far Field就是所谓的无接触式远场识音,就是通过唤醒词唤醒。目前这三种唤醒方式Link Voice都支持。
产品介入研发流程
下面着重和大家介绍,如何利用Link Voice做出一个属于自己的云单品。
在操作系统AliOS Things上,会有一个WiFi的id,还有一个DSP本地声控或者本地神经网络的部分,主要是做本地化识音处理,以上构成了一个经典的设备模组模型。
然后在麦克风阵列的数量上面,Link Voice也支持本地端麦克风阵列自定义。当然数量越多价格越高。
以跑步机为例,如果客户自由一个智能化的单品希望借助云的能力。一般是先提供产品模型,了解到产品的模型,我们会帮助产品挑选核实的合作伙伴及类型。举个例子,如果不需要本地化的模组,就可以通过轻量方式连接云端;如果需要本地化处理,可以接入合作商家芯片做本地唤醒或者本地语音识别模组。之后安装麦克风,接下来开发者可以利用一站式开发平台开发适合自己的语音交互应用,我们所有的云端资源都是开放的。最后进行产品认证测试,Link Voice产品的声学验证测试包括基本功能测试集、常用指令识别率音响设备交互控制、误唤醒率、唤醒率等指标。利用消音室、半消音室、环境噪音等条件,从不同方位,从用户不同的声音音调、分贝数等方面,对产品做一个全方位的认证和测试,测试过后可以发布上线。
我们的宗旨就是希望借助阿里云平台的力量,和供应商、开发者一起为传统的物理世界里面的物,提供语音交互能力,希望能得到更多的支持和合作。
本文由云栖志愿小组王晓慧整理编辑