这是一篇碎碎念,没有什么逻辑,没有什么目的。之前为了推广自家扫地机,发了一条可以用各种音箱控制扫地机的朋友圈,没想到很多人看到之后让推荐智能音箱。那么就总结一下用过的智能音箱,顺手给大家拔拔草种种草,也趁这个机会理一下自己的看法。
(其实本来是想写一篇硬核严肃技术文章,讲讲智能硬件对接各种IOT平台相关技术。但是目前需求没有推荐音箱大,想看的朋友们,让我看到你们热情的双手。。。)
先说说我用过哪些音箱:
- Amazon Echo
- 天猫精灵X1
- Rokid 月石
- 小豹AI音箱
- 小度智能音箱
- 小爱同学
除了叮咚和小雅,基本上国内的主流智能音箱都用过了。
为什么用过那么多音箱?
2-6都是因为工作关系,为了让自家的扫地机产品能够被各种智能音箱控制。(这里面又有一番血泪史,抽空再说吧。。。)
只有第一个Amazon Echo是自己掏钱买的,那时候还没有娃,不知养娃的贵。搁现在,领导批了budget,我也舍不得花这个钱。。。
三年前Echo刚上市,就托朋友人肉从美帝抗回来的,作为理工男、科技粉,这样坑人的事情没少干。说起来觉得最对不起的一个朋友是帮我扛了一台Roomba扫地机回来。
前几天,那位帮我带Echo的朋友问我,Echo还在用吗?为了不辜负他的汗水,我只好说,用,每天都在用。
其实并没有骗他,只不过用户不是我。2岁的女儿几乎每天都要跟Alexa say hello. 刚开始还需要我先喊“Alexa”唤醒Echo, 现在可以自己喊“Alexa, hello”,唤醒率大概能有个50%吧。 但是Alexa回一句“Hi, there”就可以咯吱咯吱笑好久。99美金感觉值了,毕竟作为一个严肃的妞儿,千金难买你一笑啊。
说了那么多废话,正儿八经的给要买智能音箱的朋友们一些建议。只讲结论,不讲过程。想具体了解每款产品功能的可以自己上网搜一下,基本上每款音箱网上都能搜到一大堆评测文章、拆机文章。虽然这种文章不能全信,(我们家的扫地机产品的评测除外),看个大概还是可以的。
- Amazon Echo:
普通用户,国内用户,不要买*3。浪费钱。 - Rokid月石:
一款特立独行的音箱。定位中高端市场,不参与价格战。工业设计水平领先其他音箱一个层次。土豪可以买。 - 小豹AI音箱:
平心而论,这个音箱是我用过的几个音箱里,正常价格下性价比最高的音箱。但只限于正常价格下。 - 小爱同学:
营销很成功的音箱,抖音的公号是每天必刷的,真羡慕有个脑洞那么大的营销团队。在大量粉丝的拉动下,小米生态链各种智能家居产品支持下,国内智能音箱市场出货量仅次于天猫精灵一点不奇怪。智能家居控制是特色。米粉或者已经有很多米家智能家居产品的,就别考虑别家的音箱了。 - 小度音箱:
有不少百度的朋友,不敢说坏话,我只能说,百度有3、4款音箱,我用的这个是最便宜,不带屏幕那个。带屏幕那个我没用过,可能会有惊喜吧。这个小度音箱,我只能说,能用。毕竟,89块钱的价格,也就够给娃买两包小饼干,还能要求什么呢。 - 天猫精灵X1:
放到最后说这个音箱。我的观点是这个音箱其实没啥特点,但却是我用的最多的音箱。没有Rokid漂亮,没有小豹的音质,没有小爱那么擅长智能家居。很中庸,但够用。如果说小豹是正常价格下性价比最高的音箱。那天猫精灵就是价格战下最值得买的智能音箱。当它不卖499,只要199,甚至99的时候,你买不了吃亏,买不了上当。今年双十一,如果还卖99,不要犹豫,闭着眼睛买,一个房间来一个。
接下去说说我没用过,但是比较想体验的音箱。
- Rokid Me
高颜值,可移动的小音箱。有一些独特的手势操作。很想尝尝鲜。但是,Rokid已经对接完了,找不到让公司掏钱买的理由啊~ - 哈曼卡顿ALLURE
颜值比Rokid还高,又有哈曼卡顿加持,就算同样放家里吃灰,也是个不错的摆设吧。之前找到腾讯云小微跪求对接,被拒。。。同样失去了让公司掏钱买的理由,唉。。。。 - Amazon Echo Show
有屏音箱,应该会带来一些体验完全不同的skill。等扫地机卖到国外去了,争取忽悠老板买一个过来玩玩。 - Google Home
目前在用的这些音箱,虽然号称智能音箱,但是更多时候还是感觉到智障更多一点。Google作为AI领域的领先者之一,我只是好奇会不会这方面好一点。但是 Google的朋友劝我不要买。。。 - Apple Homepod
果粉,不解释。另外,国内智能家居要对接个Homekit,那个苦啊。。。。
想看音箱评价的,到这里就结束了,不用往下看。
后面只是我对智能音箱或者说智能家居的一些胡思乱想。
国内智能智障音箱现状
Amazon在14年底推出了第一款智能音箱,随后过了1年多才有Google跟上。在2017年以前谈论智能音箱,基本谈论的都是这两家的音箱。随后国内开始玩C2C。各种创业公司做智能音箱,这里不得不佩服国内产业链的强大。一个喇叭加个WIFI模组,再外购一个语音方案,加个壳,很快就能拼凑出一款所谓的智能音箱了。但是2017年的上半年,还是处于热炒概念,不见量的阶段。直到巨头入场。中国的智能音箱产品才开始爆发。而爆发的那个点,毫无疑问是2017年的双十一。
天猫精灵99元的价格,让很多原本从来没听说智能音箱是什么的人都剁手了智能音箱。2017年1-10月国内智能音箱的累计销量为10万台。而双十一天一天猫精灵销售量突破100万台。目前能排进全球智能音箱出货量前五的国内智能音箱,也就天猫精灵和小爱同学两家(阿里第三,小米第五,2018Q1,阿里第三,小米第四,2018Q2)。前不久记得天猫精灵发过一个海报,号称累计出货已经突破500万台。
前面说在巨头进入前有很多小的创业公司做智能音箱,巨头进入后,就不见声音了。原因很简单,巨头从来没把智能音箱作为一个赚钱的产品。天猫精灵卖99块钱,虽然我相信BOM能cover住,但是算上其他费用,研发、营销、渠道,肯定是卖一台亏一台,小公司哪玩得起。
大公司烧钱也要做智能音箱,很多人的解释是智能音箱是未来的入口,巨头们要抢占入口。
智能音箱会不会是下一个入口,这个我是怀疑的。物联网这个概念刚起来的时候,很多人说,智能路由器会是下一个入口,于是大家纷纷开始做路由器。但是现在,好像已经很少看到路由器是入口这个说法了。
智能音箱是一个即复杂又简单的东西。说复杂是因为背后有深度学习、人工智能、云计算、物联网,几乎和当今时髦的关键词都能联系在一起。除了区块链。当然,也有号称用了区块链的智能音箱。这些技术都不是一朝一夕能掌握的。说简单,是因为单个技术都能找到现成的解决方案和供应商,甚至还能找到把几个技术做整合的集成商。不然小公司也不会很容易复刻出Echo来。
通常聊到智能音箱,都会认为有三块技术:ASR, NLP, TTS。
用大白话解释一下这三个东西。
- ASR (Automatic Speech Recognition): 自动语音识别。简单讲就是把你说的话变成文本。
- NLP (Natural Language Processing): 自然语言处理。简单讲就是让机器明白你说的话是什么意思。
- TTS (Text to Speech): 从文本到语言。简单讲就是让机器把得到的文本说出来。
这三个本是独立的技术,跟智能音箱没有什么关系。智能音箱只是这三个技术整合在一起后一个很好的载体或者说是应用。三个技术也都不是新技术,在智能音箱这东西出来前就有各自的应用。随着三个技术的不断发展和成熟,又碰到个有想法有创意的产品经理,才有Echo这样的新产品诞生。这些技术能用在智能音箱上,也自然能用在其他产品上。
智能音箱的几个问题。
前面说到,ASR、NLP、TTS这几个技术,虽然已经有了巨大进步,能够催生出Echo这样出色的产品。但个人认为,仍然有非常大提升的空间。
语音识别正确率号称能达到90%-95%,这个我是相信的。实验室环境下。比如我们做的扫地机,我也敢大胆的说,续航3小时,清扫280平米。但现实情况很复杂,有没有背景杂音,距离多远,普通话标不标准,口齿清不清楚,等等都会影响识别率。
另外,对多语言的支持也是个问题。娃很喜欢一首歌,叫《The wheels on the bus》, 我就从来没让天猫精灵成功播放过。每次只能掏出手机,打开APP,搜索这首歌,然后点击播放。
TTS, 面对中文的多音字,有时候也是挺无奈的。
当然还有其他问题,比如关键词唤醒,上下文对话等等。
在技术上,智能音箱仍然有巨大的提升空间,需要的只是时间和产品的迭代。
比起技术,其实更重要的是另外两点,一是内容,二是生态。
先谈内容。
雷军前不久晒了一下小爱同学聊的最多的10句话。排名前五的是,“你会干什么”,“几点啦”,“声音小一点”,“讲个笑话”,“小猪佩奇”。
基本和我的使用体验差不多。刚拿到设备,先问问你会干什么,之后再问问几点啦,明天天气怎么样啊,讲个笑话吧。这样的新鲜劲儿可能可以维持个1,2个小时。
然后,音箱就可能开始吃灰了。我的天猫精灵没有吃灰,因为家里有个娃,我还可以放放儿歌,听听故事。
所以,能够支撑智能音箱日活的,一定是内容。但是目前优质的内容实在是太少太少。目前我用的最多的是,某瓦儿歌,和某叔讲故事。但是对这两个节目,个人认为还只是勉强能用,远谈不上满意。最不能理解的是,为什么好好的放个节目,开头还有叽里呱啦来一段“请下载XXX手机APP,关注XXX公众号,订阅XXX节目”。
如果没有娃,那智能音箱的日常用途可能就是播放音乐。抛开版权、资源问题不谈,真正喜欢听音乐的,是用几十块钱的喇叭来听好呢,还是用功放,或者用个耳机听更好呢?
另一类内容是一些对音质没有要求的,比如相声,比如某些商业类财经类节目。这些需求有多少,我没数据,从我个人来讲,这两类属于戴着耳机伴我入眠类节目。从来没有在音箱上播放过。
对于内容的一点期待。
一类是更干净,更高质,更具有连贯性的幼儿节目。这类内容应该是我愿意花钱去购买的。
另一类,是问答类。能回答某某单词的英文是什么,1+1等于几这种问题是远远不够的。
说完内容再说生态。
这里说的不是智能音箱产业生态,而是指智能家居生态。如果内容不足以支撑音箱的日活,那另一个能打动我去频繁使用智能音箱的理由就是智能家居的控制。这方面比较突出的就是小米的小爱同学这款音箱。对小米这家公司,我是又爱又恨,爱的是小米的东西,确实性价比高,自己也买了不少小米及其生态链企业的产品,从一开始的手机,到灯泡,插线板,传感器等等,渐渐的发现,要打造一个智能的家已经没有办法摆脱小米的影子了。说恨也是因为小米出色的性价比。自己做扫地机了,才明白小米有多狠。把好好的一个渗透率才5%不到的朝阳产业搞的连传统小家电平均毛利率都达不到,只能先赔本赚吆喝。至少在智能家居这一行,小米值得学习的地方实在太多,令人敬畏。
回到智能家居生态这个话题,目前的音箱做的只能说是刚起步。
自家的扫地机,对接了5家IoT平台。目前能实现哪些功能呢。比如你可以对音箱说“打开扫地机”,“关闭扫地机”,“暂停、继续”。一定程度上,确实能够解决一些问题,避免了掏出手机用APP去控制的麻烦。但是仍然无法完全取代手机APP。你无法跟音箱说“客厅中间有点脏,去扫一下”,“扫个地,主卧有人在睡觉,别过去”。这是我们努力的方向,但至少目前,没有一个平台能够实现。
就在写这篇文章的时候,某数字公司IoT平台的同学跟我说:“想想看,我现在要出门。掏出手机在京东微联上把格力空调关上,再用米家把家里所有的灯关掉,再打开欧瑞博门锁开启安防模式...”
我告诉他这就是现状。他说“我觉得这现状很蛋疼”。
确实很蛋疼。
大多数的智能家居单品对接完智能音箱也只能实现一些基本操作,比如开和关,设置频道、模式。然后通过平台自己的一些场景设置,来关联一些其他的设备。比如,我定义一个“离家”模式,当我出门的时候,灯和电视关闭了,扫地机开始扫地。这个还是离不开APP去预先定义好模式,做好相关的配置工作。对于我这样的,算是半个业内人,也懒得去用这样的功能。我理想中的智能家居应该是:当我说我明天需要8点起床的时候,在第二天早上7点50窗帘渐渐拉开,音乐逐渐响起,8点10分咖啡机已经煮好咖啡。当我吃早饭的时候能告诉我一天的提醒事项,当我出门的时候告诉我记得带伞,帮我发动汽车打开空调。当我不在家的时候能把地扫干净,家有有啥情况能及时通知到我。而这一切,都应该不需要我去走到音箱附近,用一个唤醒词比如“天猫精灵”、“小爱同学”唤醒它,再告诉它我要打开什么模式,几点要干什么。
这只是一个美好的愿景,离这一天或许还有很长的距离。
但是光凭音箱去简单控制一个家电,这个是远远不够的,这个也不叫智能家居生态。
技术的局限,优质内容的缺失,智能家居生态的不完善。这个让我对智能音箱的未来是保持谨慎的乐观。
目前的智能音箱在我看来,应该换个名字更贴切,叫家庭智能语音助手接入点。首先它的范围局限在家庭,其次它称不上智能,充其量只是个助手,最后它只是一个接入点,一个像键盘显示器一样的一个终端设备。
透过现象看本质,智能音箱只是一个皮囊,它的本质是技术的发展带来的新的服务形式。核心是人工智能和物联网,依靠的是优质的内容和丰富的生态。有句话叫“好看的皮囊千篇一律,有趣的灵魂独一无二”。这句话放在智能音箱也是适用的。能够让我购买产品后继续花钱使用的,一定是背后有趣的灵魂,也就是服务。而皮囊是什么,并不重要。所以回到之前的话题,智能音箱是入口吗?我觉得不是。
我需要的不是一个廉价的喇叭,我需要的只是一个有趣的灵魂。至于它在哪里,并不重要,我要的是它无处不在。电视机?扫地机?冰箱?洗衣机?都可以成为接入点。但并不是像现在某些产品,嵌一个语音模块,wifi模块,就敢号称智能家电了。我需要的是万物互连,信息共享,独一无二的那个智能家居的灵魂。
全屋智能必然是发展方向,或许要实现这个智能家居的灵魂,并不需要智能音箱这么个载体,单个的智能音箱是远远不够的。端边云结合也是智能家居一直在谈的一个话题,端负责信息的收集和基础加工,边缘计算负责信息的处理和交换,最终在云端汇集。
最后猜测下可能会发生的事情。
- 智能音箱mini化,这个其实不是可能发生,而是正在发生的事情,各大音箱纷纷出了mini版。但是还不够mini。期望是能做到乒乓大小,待机以月计。
- 可移动的音箱。其实也就是一个简化了的家庭服务器人了。如果不能让音箱全屋覆盖,不如让音箱动起来。曾一度还挺想做这个的。
- 智能面板、插座,带麦克风阵列那种。家装的时候直接嵌入。听说有同学在做这方面的创业,祝好。。。
上周末听了个讲座,讲中国资本市场。谈到互联网行业,该教授的观点是,这是跟传统行业完全相反的一个行业,只有第一,没有第二。智能家居是一个传统行业互联网化的行业。有没有第二不知道,但目前看,能玩得起的,也只有几个巨头。