近两年,人们对下一代计算平台和交互方式的不断探索,将AR技术推向了万众瞩目的焦点,其中AR眼镜被视作未来有望独立于手机、电脑之外的“第三块屏幕”。
而祝铭明对AR眼镜的想象远远不止于“屏幕”。在对谈开始前,他向我们展示了Rokid最新款的AR眼镜以及Rokid Station。祝铭明佩戴上AR眼镜,通过蓝牙连接外置设备Station,一个写代码的工作桌面在他的眼镜中呈现,加上一个键盘就可以开始写代码了。
Rokid Station搭载了阿里云的云电脑——无影,连接云端和眼镜端,完成轻量化计算、4K高清解码等通用能力,突破了人们对于移动计算平台的想象,让沉浸式的云上办公和娱乐成为可能。
本期「云谷创新谈」邀请了Rokid创始人兼CEO祝铭明,阿里云无影解决方案架构师皮剑,由阿里云无影解决方案架构师皮剑、阿里云无影产品运营沈琦联席主持,围绕“消费级AR眼镜”话题,一起畅聊下一代的AR人机交互新风向。
1.AI赋能加速消费场景延伸 Rokid Station提供AR智能终端支持
Rokid成立于2014年,专注人机交互技术和人工智能软硬件产品开发,产品涵盖智能家庭机器人、智能音箱、增强现实(AR)眼镜,以及人工智能应用与服务,使用覆盖影音娱乐、工业、办公等多个领域。
创始人祝铭明将Rokid定位为“一家AI加上AR技术打底的人机交互公司”。做过AI机器人,做过工业级、企业级的AR眼镜,在当下,Rokid将AI与AR相结合,向消费级AR眼镜发起了挑战。
祝铭明表示:“AR本身更强调展现能力和交互能力,AI技术在输入、交互、用户感知层面介入,比如通过AI的赋能实现空间感知、手势感知、语音识别等能力,可以让AR眼镜从简单的一个显示器不断向前演进,最终会进入一个丰富的、更自然的人机交互模式,比如能够实现意图识别。”
“行业早期的时候,行业里很多厂商重在展示AI的能力,并没有考虑到用户实际的交互体验。其实真正到一个成熟的产品阶段,应该更多地让大家感受到它带来的结果,而不是展示它的能力本身。”
在祝铭明看来,消费者对AI的理解不会很深入,他们在购买AR眼镜时,主要基于使用感知来选择,核心需求是:屏幕要够大、显示要清晰、色彩要自然、内容足够多、生态够丰富,在交互上要求简单、便捷、舒适。AI不是消费者必须买单的理由,交互,才是消费者选择的关键。
“任何的技术用在消费类的产品里,反而要把它藏起来,最后表现出来的是更自然、更舒服、更快捷的交互。”
2021年9月,Rokid发布了消费级AR智能眼镜Rokid Air,基于AI语音识别能力,消费者只要说出想看的内容,就能控制AR眼镜的展现。但在这个阶段,Rokid的AR眼镜主要连接手机和平板电脑来使用,在适配终端上有一定的限制。
祝铭明表示:“受工艺生产、功耗、电池、通信等诸多方面的限制,一体式眼镜的能力有限,只能做一些导航、信息提醒等的简单功能。如果选择做分体式AR眼镜,又分为连接手机、连接外置设备两种。采用手机连接的方式存在三个问题:续航不足,高度碎片化,兼容性问题,很容易出现续航2小时关机,或是在沉浸式使用中被各种软件打断,或是某个品牌的手机无法支持等等问题。”
Rokid选择从外置设备进行突破,紧接着2022年,AR眼镜专属智能终端Rokid Station发布。Rokid Station搭载了无影架构,支持观看在线影视与本地视频,预装300多款游戏并支持3A云游戏大作,同时还支持云电脑办公。通过无影云端的海量算力和存储空间,在交互、视觉、隐私方面带来了全新的AR体验。
继Station问世起,Rokid旗下消费类AR系列产品的渠道订单就突破了5万套,短短一年时间共计获得订单十余万套。在3月21日的新品发布会前,消费级的Rokid Air就已经全部售罄。
“推出Station还有一个原因。AR眼镜会越来越轻薄,但是芯片和算力的发展很难追上对轻薄的认知,而用户对轻薄的需求永远是第一位的,哪怕算力再高一点,用户也只会要求AR眼镜做得薄一些、轻一点。”
较好的展现力需要较高的算力,而消费者所需的佩戴舒适性又要求设备的轻薄,两者之间的矛盾一直困扰着业界。
Rokid的设计思路是进行拆分,将算力拆分到本地端、边缘端以及云端,让AR眼镜成为展现和交互的载体,通过云电脑来解放本地系统的算力。祝铭明表示:“无影最大的好处是可以基于这种弱终端设备获得强大的算力。理论上来讲,搭载无影的Station可以成为一个算力不断增强的终端。”
Rokid Max+Station
02.云电脑解放本地终端算力 无影为AR眼镜带来沉浸式交互
祝铭明既是Rokid Station的开发者,也是忠实消费者。他大部分时间都在使用Rokid Station办公,有时候会在办公室,有时候在咖啡厅。无论何地,他只要戴上AR眼镜,连上键盘,通过无影的云电脑就能开始原地办公。
“戴着搭载无影的AR眼镜,最大的好处是随时可以离开,哪怕工作到一半,关上电脑就可以离开,不必先关机拔电源,还可以登录多个账号,摘下眼镜还能在电脑上继续。对于没有设备条件的人来说,不必买昂贵的专业电脑才可以进行写代码或者渲染。”
如何看待云电脑与AR眼镜的结合,皮剑表示,消费者的需求是多样化的,而无影一直主打轻便灵活,期望让用户无论在何时、何地都可以进行访问,并实现丰富的交互。AR眼镜作为一种新的交互方式,成为了无影很重要的一个扩充端,通过AR+AI+云的方式,可以释放很多消费场景下的想象力。
将AR眼镜与云电脑结合,当中面临着不少的挑战,皮剑回顾这次与Rokid的跨生态合作,认为最关键的工作是终端适配。作为AR眼镜智能终端,Rokid Station的安卓系统与普通手机、平板电脑的系统存在差异。“无影是一台跑在云上的电脑,拥有跨终端、跨系统的能力,针对Rokid的终端系统的问题,无影做了很多定制开发工作,包括系统兼容、登录方式等,我们期望能把它变成一步到位的、能够快速注册和登录的终端。”
此外,无影采用的API传输协议,具备弱低带宽、低延迟的入网兼容能力,可以根据用户的网络状态、操作帧率的大小进行弹性调节,同样的产品做同样的高帧率操作,无影更显流畅和精细化。对此,祝铭明同感:“我有时候不告诉别人,他们都不知道这是跑在云端。”
无影还提供了很多企业级的功能,包括安全管控、批量运维等能力,皮剑介绍:“无影能够获得很多客户的认可,主要是因为数据都在云上。以登录为例,如果没有开放外设的这个重定向权限,那该外设就是一个黑盒沙箱,外部用户无法带走数据,无影的外设重定向能力可以避免用户更换终端时需重新登录的问题。未来AR眼镜想要进一步发展,需要将某些本地数据跟云电脑进行通信,目前对于无影的技术来说,都是可以实现的。”
从开发成本来看,无影迭代出标准化的SDK产品,可以帮助Rokid这样的集成类消费级的客户,以低成本完成定制化开发。
Rokid AR+无影解决方案
03.融畅想下一代互联网形态 无影与Rokid共建AR新生态
在祝铭明的理解中,AR包含五个层面:感知、理解、协同、展示和交互、数字内容生成,这五个层面构成了AR大产业的发展闭环,对祝铭明来说,消费级的AR眼镜只是这个闭环中的一节。
“未来新的终端之战,最终会落在生态之争。新的终端并不一定要求内容多,关键在于能否打穿用户的需求。”
祝铭明带领的Rokid正在试图构建一个AR产业生态。
“AR产业正进入一个过渡阶段,有两个生态系统在此重叠:一个是向后兼容,一个是向前探索。”向后兼容生态,指的是AR眼镜作为除电脑、手机外的“第三块屏幕”,可以兼容原有的观影、游戏、办公等已经成熟的功能,重新形成新的AR生态。向前兼容生态,指的是在空间展示、自然交互、AI交互上进行新的探索。
对于Rokid来说,70%的精力是向后看,30%的精力向前看。
为何将大部分的精力放在向后看上,祝铭明认为:“在这一阶段,消费者更容易看到、更容易体验的是对过去成熟方案的兼容,所以向后看也是很多公司的选择。很多外国产品做得很酷炫,但是用户拿到都不知道该怎么用,这是因为他们没有解决向后兼容的问题。”
另一方面,前沿技术的应用会带来价格的高涨,消费者很难为了不需要的功能去承担溢价,因此在Rokid向前看的探索中,更多是基于ToB或是B2C的业务来承载。
“但不管怎样,一定要形成闭环,找到它真正应用的场景。”
祝铭明将Rokid划分为三个事业部:CBG消费者事业部(C端)、EBG工业部(B端)、B2C业务部。
CBG消费者事业部主要针对消费者的三大需求:影音、游戏、办公。
EBG工业部强调降本增效,发挥AR+AI的工具性,可以实现远程协助、远程培训数字孪生等,同时可以探索更多前沿技术的结合,比如光波导技术、空间定位技术等。
B2C业务部为B端客户提供C端消费者体验的产品,更强调C端用户的使用感受,例如针对博物馆场景,Rokid就为全国100多家博物馆提供AR+AI服务,B2C场景的应用迁移,更像是一座桥梁,将工业级的产品向C端消费场景迁移。
Rokid也在积极开展生态化合作,寻求不同的合作伙伴,最终实现终端互联。而无影,正是Rokid重要的生态合作伙伴。
无影也在不断优化,致力于向电脑体验持平,并成为全量终端。无影的目标是希望不管是软件还是硬件,或是APP等所有终端,都能结合无影的能力在他们的产品能力提升,实现降本增效,以低成本实现定制化开发。