智能副驾是搜狗在 AI 落地应用上的全新探索

简介:

AI 热潮袭来,受到了各大企业和资本方的追逐,而很多移动互联网企业也大都一头扎进这个领域,欲成为这场技术革新的引领者,或至少成为早期参与者。

不过,从目前的情况来看,放眼整个 AI 领域,跟随者甚众,但落地产品寥寥。而作为率先入局者之一的搜狗,不同于其他巨头们企业争相布局通用型 AI 平台的思路,而是基于其在 AI 领域的天然优势,选择深挖垂直领域做功能型人工智能。

7 月 18 日,搜狗地图智能副驾这款产品推出,这是搜狗通过整合自身资源在人工智能落地上一个全新方向的探索,其中的隐含意味是:这只是一个开端,搜狗地图未来还将承载更多 AI 落地的方向。「毫无疑问,地图是非常好的承载平台。」搜狗地图总经理孔祥来告诉雷锋网(公众号:雷锋网)智能副驾是搜狗在 AI 落地应用上的全新探索

这款智能副驾产品支持用户全程进行语音交互,一定程度上解放了驾驶员的手和眼,给用户带来更智能、安全和便捷的驾驶体验和乐趣。

开发这款产品之前,搜狗地图团队为此收集了 1 万多份用户调查问卷,做了充分的用户需求调研。他们发现,用户在车内的最常见需求都跟行驶以及互联网消费相关。虽然车企以及同行业其他服务商也有相关产品落地,但孔祥来认为,以目前竞品的语音交互技术来说,用户体验等方面都不够好。

而这也是他们选择从这个应用场景切入的缘由,搜狗也有能力大幅度提升此类产品的交互体验。除了在发布会所提到的技术外,孔祥来以搜狗的语音识别这个技术细节为例进行了阐述:由于智能副驾这款产品是在搜狗内部做深度集成,所以地图团队会独享一些不对外开放的接口。

「现在你去看任何一家语音识别,只要开放 SDK 这种,你去把用户输入的音频流给到它,它只给你单一结果,而搜狗的语音识别会给到我们 N 个结果。虽然说大家的语音识别率做得比较高了,95% 也好,还是 96%、 97%,这是单字识别率,说了一百个字,95 个字是对的。事实上我们仔细想一想,用户整句表达的时候,在车内至少要说 7 个字,他想表达自己需求的时候,那 97% 的识别率一下子就掉到了 80%。」

「如果你只输出单一结果,这意味着一句话中间错了一个字,后面的语义理解可能就挂掉了,这就是为什么我们一开始在内部做深度耦合解决这个问题。因为搜狗的语音识别对内合作是有多个结果,它会告诉我,识别概率最高的一个结果。」

同时,他们也发现,输出的结果排第二、第三位的也有可能是对的,这又如何解决?当然是通过后面的语义理解、分析引擎,从而判断出第一个不对,第二个或第三个才是对的。

「比如我们经常会问,我已经给你找到一个地方了,你是不是要确认?用户可能会说确认,但是用户说确认非常短,就是两个字的一句话,这种短语句的识别,都是语音识别的难点,有时第一个识别结果并不是对的,但是我们在后面可以挽救回来。」孔祥来告诉雷锋网。

还有一个问题是,纵观业内做语音识别的公司的语音识别率都号称达到 97% 左右,但在产品上的效果却不尽人意,却是为何?孔祥来对此解释说,除了噪声以外,在相对安静的环境下,识别率其实也没有想象中那么高。很重要一个原因是,过去的产品之所以强调正确率,仍然是把它当做语音识别看待,而现在讨论的范畴并不仅限于此,还包括语义理解以及(数据)分发技术都要与之匹配。

就单独做语音技术的公司而言,国内不乏佼佼者。它们有非常强的技术,但缺乏地图所需要的数据。而有的地图服务商虽然有数据,却没有足够好的语音交互技术。

搜狗地图兼具两者优势,「像搜狗有自己的语音识别,有庞大的语义理解团队,有地图搜索、导航能力,后面还有大搜索,搜狗所有的技术都是自有化状态。」孔祥来称,这也是搜狗地图团队对智能副驾会在车内形成竞争优势的信心所在。

不过,搜狗地图并不急于通过这一款产品去抢占更多市场份额,「这个不是我们现在关注的重点,我们推出这款产品的根本目的还是希望 AI 技术通过某种方式落地」,他说。

雷锋网了解到,目前搜狗地图已与福特、博世等公司建立了深度合作关系,而智能副驾的推出会更有利于提升这些车企对他们实力的认知。据了解,最新上市的福特翼搏已经使用了搜狗专门定制开发的系统,并对所有的交互逻辑都做了深度定制。未来将会有更多车型搭载搜狗智能副驾。

除了搜狗地图发布智能副驾外,搜狗在今年下半年到明年还会有一系列「大动作」。「你会发现,一定会有越来越多的 AI 产品发布,因为这本身就是搜狗正在努力做的方向。」孔祥来说道。

本文作者:王金许

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
17天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用及前景展望
本文旨在探讨人工智能(AI)技术在医疗诊断领域的应用现状、挑战与未来发展趋势。通过分析AI技术如何助力提高诊断准确率、缩短诊断时间以及降低医疗成本,揭示了其在现代医疗体系中的重要价值。同时,文章也指出了当前AI医疗面临的数据隐私、算法透明度等挑战,并对未来的发展方向进行了展望。
|
20天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用
【10月更文挑战第42天】本文将探讨人工智能(AI)在医疗诊断中的应用,包括其优势、挑战和未来发展方向。我们将通过实例来说明AI如何改变医疗行业,提高诊断的准确性和效率。
|
13天前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
162 64
|
6天前
|
机器学习/深度学习 人工智能 JSON
【实战干货】AI大模型工程应用于车联网场景的实战总结
本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。
|
9天前
|
数据采集 机器学习/深度学习 人工智能
AI在医疗诊断中的应用与挑战
随着人工智能(AI)技术的飞速发展,其在医疗领域的应用也日益广泛。从辅助医生进行疾病诊断到提供个性化治疗方案,AI技术正在改变着传统医疗模式。然而,AI在医疗诊断中的应用并非一帆风顺,面临着数据质量、模型可解释性、法规政策等一系列挑战。本文将从AI在医疗诊断中的具体应用场景出发,探讨其面临的主要挑战及未来发展趋势。
|
10天前
|
人工智能 JSON 自然语言处理
智能化AI工具-语言翻译与本地化
在全球化发展的背景下,语言翻译与本地化需求日益增长。无论是跨境电商、国际合作,还是本地化应用开发,都需要高效、准确的翻译解决方案。阿里云通义千问作为一款强大的大语言模型,不仅具备出色的自然语言理解能力,还能够在多语言翻译和本地化场景中发挥重要作用。本博客将详细介绍如何基于阿里云通义千问开发语言翻译与本地化工具,包括产品介绍、程序代码以及阿里云相关产品的具体使用流程。
42 10
|
8天前
|
机器学习/深度学习 人工智能 机器人
AI技术在医疗领域的应用及挑战
本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的定义和分类开始,然后详细介绍其在医疗领域的具体应用,如疾病诊断、药物研发等。最后,我们将讨论AI在医疗领域面临的挑战,包括数据隐私、伦理问题等。
|
8天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在医疗领域的应用##
在现代医疗领域,人工智能(AI)技术正在逐步改变传统的诊疗方式。本文将探讨AI在医疗中的几个关键应用,包括医学影像分析、疾病预测和个性化治疗等。通过这些应用,AI不仅提高了诊断的准确性和效率,还为患者提供了更加精准的治疗方案。 ##
23 2
|
8天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在医疗领域的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗健康领域中的多维度应用,从疾病诊断、个性化治疗到健康管理,展现了AI如何革新传统医疗模式。通过分析当前实践案例与最新研究成果,文章揭示了AI技术提升医疗服务效率、精准度及患者体验的巨大潜力,并展望了其在未来医疗体系中不可或缺的地位。 ####
|
17天前
|
机器学习/深度学习 人工智能 算法
强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用
本文探讨了强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用,通过案例分析展示了其潜力,并讨论了面临的挑战及未来发展趋势。强化学习正为游戏AI带来新的可能性。
50 4