AI 热潮袭来,受到了各大企业和资本方的追逐,而很多移动互联网企业也大都一头扎进这个领域,欲成为这场技术革新的引领者,或至少成为早期参与者。
不过,从目前的情况来看,放眼整个 AI 领域,跟随者甚众,但落地产品寥寥。而作为率先入局者之一的搜狗,不同于其他巨头们企业争相布局通用型 AI 平台的思路,而是基于其在 AI 领域的天然优势,选择深挖垂直领域做功能型人工智能。
7 月 18 日,搜狗地图智能副驾这款产品推出,这是搜狗通过整合自身资源在人工智能落地上一个全新方向的探索,其中的隐含意味是:这只是一个开端,搜狗地图未来还将承载更多 AI 落地的方向。「毫无疑问,地图是非常好的承载平台。」搜狗地图总经理孔祥来告诉雷锋网(公众号:雷锋网)。
这款智能副驾产品支持用户全程进行语音交互,一定程度上解放了驾驶员的手和眼,给用户带来更智能、安全和便捷的驾驶体验和乐趣。
开发这款产品之前,搜狗地图团队为此收集了 1 万多份用户调查问卷,做了充分的用户需求调研。他们发现,用户在车内的最常见需求都跟行驶以及互联网消费相关。虽然车企以及同行业其他服务商也有相关产品落地,但孔祥来认为,以目前竞品的语音交互技术来说,用户体验等方面都不够好。
而这也是他们选择从这个应用场景切入的缘由,搜狗也有能力大幅度提升此类产品的交互体验。除了在发布会所提到的技术外,孔祥来以搜狗的语音识别这个技术细节为例进行了阐述:由于智能副驾这款产品是在搜狗内部做深度集成,所以地图团队会独享一些不对外开放的接口。
「现在你去看任何一家语音识别,只要开放 SDK 这种,你去把用户输入的音频流给到它,它只给你单一结果,而搜狗的语音识别会给到我们 N 个结果。虽然说大家的语音识别率做得比较高了,95% 也好,还是 96%、 97%,这是单字识别率,说了一百个字,95 个字是对的。事实上我们仔细想一想,用户整句表达的时候,在车内至少要说 7 个字,他想表达自己需求的时候,那 97% 的识别率一下子就掉到了 80%。」
「如果你只输出单一结果,这意味着一句话中间错了一个字,后面的语义理解可能就挂掉了,这就是为什么我们一开始在内部做深度耦合解决这个问题。因为搜狗的语音识别对内合作是有多个结果,它会告诉我,识别概率最高的一个结果。」
同时,他们也发现,输出的结果排第二、第三位的也有可能是对的,这又如何解决?当然是通过后面的语义理解、分析引擎,从而判断出第一个不对,第二个或第三个才是对的。
「比如我们经常会问,我已经给你找到一个地方了,你是不是要确认?用户可能会说确认,但是用户说确认非常短,就是两个字的一句话,这种短语句的识别,都是语音识别的难点,有时第一个识别结果并不是对的,但是我们在后面可以挽救回来。」孔祥来告诉雷锋网。
还有一个问题是,纵观业内做语音识别的公司的语音识别率都号称达到 97% 左右,但在产品上的效果却不尽人意,却是为何?孔祥来对此解释说,除了噪声以外,在相对安静的环境下,识别率其实也没有想象中那么高。很重要一个原因是,过去的产品之所以强调正确率,仍然是把它当做语音识别看待,而现在讨论的范畴并不仅限于此,还包括语义理解以及(数据)分发技术都要与之匹配。
就单独做语音技术的公司而言,国内不乏佼佼者。它们有非常强的技术,但缺乏地图所需要的数据。而有的地图服务商虽然有数据,却没有足够好的语音交互技术。
搜狗地图兼具两者优势,「像搜狗有自己的语音识别,有庞大的语义理解团队,有地图搜索、导航能力,后面还有大搜索,搜狗所有的技术都是自有化状态。」孔祥来称,这也是搜狗地图团队对智能副驾会在车内形成竞争优势的信心所在。
不过,搜狗地图并不急于通过这一款产品去抢占更多市场份额,「这个不是我们现在关注的重点,我们推出这款产品的根本目的还是希望 AI 技术通过某种方式落地」,他说。
雷锋网了解到,目前搜狗地图已与福特、博世等公司建立了深度合作关系,而智能副驾的推出会更有利于提升这些车企对他们实力的认知。据了解,最新上市的福特翼搏已经使用了搜狗专门定制开发的系统,并对所有的交互逻辑都做了深度定制。未来将会有更多车型搭载搜狗智能副驾。
除了搜狗地图发布智能副驾外,搜狗在今年下半年到明年还会有一系列「大动作」。「你会发现,一定会有越来越多的 AI 产品发布,因为这本身就是搜狗正在努力做的方向。」孔祥来说道。
本文作者:王金许
本文转自雷锋网禁止二次转载,原文链接