简述智能对话系统

简介: 对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

综述


对话系统(Dialogue System,简称DS),是使人与机器可以通过自然语言进行对话交互的系统。DS除了用准确、简洁的自然语言回答用户用自然语言提出的问题外,更注重与人的交互、对人意图的理解、对对话氛围的感知,以及回答的多样性和个性化。

网络异常,图片无法展示
|


分类


交互模式

按交互模型划分为文本客服机器人和语音客服机器人。

文本客服机器人

主要包含NLU、DM、NLG等技术

语音客服机器人

除了NLU、DM、NLG等技术之外,还包含ASR、TTS。

场景和功能类型

问答型机器人

问答机器人主要依托于强大的知识库,可对用户提出的问题给出特定回复。对回复内容的准确性要求高,但仅限于一问一答的单轮对话交互,对上下文信息不作处理,目前多用于客服领域。

基于检索匹配的问答技术

基于检索匹配的问答技术通过语义匹配的方式从给定的问答数据集中找出最相似的问题并给出答案。这种方式简单有效,针对问题和答案相对固定的业务场景,通常能够实现较好的对话效果。


网络异常,图片无法展示
|


基于阅读理解的问答技术

基于阅读理解(Document Understanding,DU)的问答技术旨在围绕给定篇章文档内容完成问答任务。具体而言,该技术面向给定的一篇或若干篇文档,对于用户对话中提出的与文档相关的问题给出正确的回答。该技术主要通过问题理解、段落排序和机器阅读理解等几个主要技术流程实现。

在基于阅读理解的问答技术中,让机器能够阅读自然语言文本,然后回答相关问题的机器阅读理解是核心,也是提升基于阅读理解的对话效果的关键。

网络异常,图片无法展示
|


任务型机器人

机器人通过多轮对话交互满足用户某一特定任务需求。对任务完成度要求高,其中机器人主要通过对话状态追踪、问槽、澄清等理解用户意图,然后进行回复或调用API等形式完成用户任务需求,如订票、订餐等任务。

实现技术

任务型对话系统目前主要有两种实现技术,一种是基于流水线(pipeline)的实现方式,另一种是基于端到端(end-to-end)的实现方式。

网络异常,图片无法展示
|


流水线(pipeline)

网络异常,图片无法展示
|


实现的对话系统的经典结构图,又称规则对话系统。

整个系统有四大核心模块,分别由NLU、DST、DPL和NLG依次串联构成的一条流水线,各模块可独立设计,模块间协作完成任务型对话。

  1. 自然语言理解(NLU):主要对人机交互过程中产生的对话进行语义理解;
  2. 对话状态跟踪器(DST):管理每一轮对话状态,包括历史状态记录及当前状态输出;
  3. 对话策略(DPL):基于当前对话状态执行的下一步系统回应策略;
  4. 自然语言生成(NLG):将对话策略输出的语义转化成自然语言。
端到端(end-to-end)

网络异常,图片无法展示
|


端到端(end-to-end)的对话系统,主要是结合深度学习技术。采用数据模型驱动,通过海量数据训练,挖掘出从用户自然语言输入到系统自然语言输出的整体映射关系,而忽略中间过程的一种方法。

就目前工业界整体应用而言,虽然端到端(end-to-end)的方法灵活性和可拓展性较高,但其对数据的质量和数量要求也很高,同时还存在不可控性和不可解释性等问题,因此工业界的对话系统目前大多采用的还是基于规则的流水线(pipeline)实现方式。

业务场景

任务式人机对话系统业务场景分为两大类型,即信息检索类服务满足类

信息检索类

信息检索类对话系统接收用户以语言形式发出的指令,经过对话理解、对话管理、指令执行和语言生成等环节,查询到用户所需信息并组织语言返回,如智能客服。

服务满足类

服务满足类对话系统的处理流程与信息检索类大致相同。不同之处在于,服务满足类对话系统通常不需要对用户进行自然语言形式的反馈,而是经过对话理解、对话管理和指令执行等环节完成用户发出的指令即可,如天猫精灵。

闲聊型机器人

机器人与用户互动比较开放,用户没有明确目的,机器人回复也没有标准答案。对回复内容的准确度不做要求,主要以趣味性和个性化的回复满足用户情感需求。

闲聊型智能对话的技术框架有两种主流形式,一是基于检索技术的聊天式对话系统,二是基于端到端技术聊天式系统。

基于检索技术的聊天系统

基于检索技术的聊天系统通常由检索模型、匹配模型和排序模型构成。对于给定的用户输入话语,首先由检索模型 在对话语料库中查找类似场景并返回多个候选对话问答对,然后由匹配模型判断候选问答对是否可以作为当前用 户话语的合理回复,最后由排序模型根据应用场景做一些适配定制后给出最终的回复。该系统由于可以直接使用 人类回复,因此在回复的通顺性和风趣性等方面占有优势,但由于缺乏自由度,无法生成从未存在过的新句子,因 此被认为不能达到理想状态的对话智能。

基于端到端建模技术的聊天系统

基于端到端建模技术的聊天系统 把对话问题当成翻译问题,将对话的上文看做源语言,将对话的下文看成目标语言,使用基于序列到序列的神经网络生成模型直接生成对话回复。对于给定的用户输入话语,端到端建模技术首 先使用编码器网络将该输入话语编码为中间语义表示,然后借助解码器网络将该中间语义表示逐步解码为对话回 复。端到端模型可以克服检索模型无法生成全新回复的缺陷,能够生成在对话实例库中从未出现过的回复,但由于 缺乏对用户话语和回复机制相应的干预,难以保证生成的回复富含信息并和上下文保持连贯性。

网络异常,图片无法展示
|


智能对话系统的商业和社会价值


行业级(B端)的价值提升

  • 金融业---问题咨询、外呼、工单管理等客服场景中。
  • 零售业---为用户提供个性化产品建议,并主动推送相关产品。
  • 制造业---嵌入智能对话系统,使用户可以控制具有对话式交互功能的电器设备。
  • 政务领域---智能终端可以通过多轮对话快速准确地引导群众定位办事流程,收审所需材料,大幅压缩了等待时间。

消费者(C端)的体验升级

  • 丰富数字生活---购物、烹饪、外卖、出行、家政、游戏、观影、健身等活动都可以借助语音助手等智能对话产品。
  • 助力儿童教育---在早教场景中,伴读机器人引导儿童阅读,在K12教育中,家教机器人能够帮助提升学习效率、丰富学习的趣味性。
  • 改善社会福利---通过智能语音穿戴设备随时监控老年人的身体状态,并接听语音指令下的电话呼叫以提供及时救助。“智能语音护理床”的出现使得患者可通过对话自行控制护理床状态。
  • 服务特殊群体---对于有视觉障碍和语言障碍的特殊群体来说,目前市场中的智能语音客服和语音助理为处理个人事务提供了便利。


相关文章
|
人工智能 机器人 数据安全/隐私保护
【必看!】阿里云推出QWen-7B和QWen-7b-Chat,开放免费商用!
阿里云最近发布了两款大型开源模型QWen-7B和QWen-7b-Chat,这两款模型的参数规模达到了70亿,用户可以在Hugging Face和ModelScope上免费使用。尽管大型模型的热度近期有所下降,但阿里云选择开源模型来赢得用户的支持,并保持自身在竞争中的优势。这一举措也引起了人们的关注,因为不开源可能会导致信息泄露的风险。通过开源模型,阿里云既能满足用户需求,又能保持技术竞争力。
1636 0
 【必看!】阿里云推出QWen-7B和QWen-7b-Chat,开放免费商用!
|
Java
BigDecimal类型的数据如何做绝对值和相除求百分比
BigDecimal类型的数据如何做绝对值和相除求百分比
406 3
|
5月前
|
存储 Android开发 数据安全/隐私保护
安卓手机和苹果手机如何快速完成文件互传?安卓手机文件传到苹果手机方法分享
在日常工作中,跨设备文件传输需求频繁,尤其是Android与iOS之间。本文推荐一款名为LocalSend的工具,支持Android、iOS、Windows、Mac平台,通过局域网实现快速、安全的文件互传,无需互联网连接。操作简便,界面直观,适合多设备用户使用。
1939 1
|
机器人 智能硬件
基于STM32的电机控制系统设计与实现
基于STM32的电机控制系统设计与实现
656 1
|
移动开发
PhpSpreadsheet生成Excel时实现单元格自动换行
PhpSpreadsheet是PHPExcel的替代版本,PHPExcel的作者已经停止了更新,今天尝试了使用PhpSpreadsheet生成Excel的时候支持单元格内的自动换行,发现用法其实差不多。
3555 0
|
1月前
|
搜索推荐 数据可视化 数据库
用Python轻松打造专业PPT:自动化生成演示文稿全攻略
本文介绍如何用Python的python-pptx库自动化生成PPT,涵盖环境搭建、文本、图片、图表插入,以及批量生成与模板应用技巧。通过代码高效创建格式统一、内容丰富的演示文稿,大幅提升职场效率,适合报告、教学等场景,让PPT制作从繁琐变为智能。
840 1
|
7月前
|
存储 机器学习/深度学习 算法
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty 敏感词
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty 敏感词
KMP、Trie树 、AC自动机‌ ,三大算法实现 优雅 过滤 netty  敏感词
|
运维 Prometheus 监控
如何在测试环境中保持操作系统、浏览器版本和服务器配置的稳定性和一致性?
如何在测试环境中保持操作系统、浏览器版本和服务器配置的稳定性和一致性?
|
传感器 消息中间件 物联网
常用的物联网协议
常用的物联网协议包括:MQTT(消息队列遥测传输)、CoAP(受限应用协议)、HTTP/HTTPS、LWM2M(轻量级机器对机器)和Zigbee等。这些协议在不同的应用场景中发挥着重要作用,如数据传输、设备管理等。
1407 2
|
安全 关系型数据库 MySQL
Linux(CentOS6)安装MySQL5.6
Linux(CentOS 6)系统上安装MySQL 5.6版本的详细步骤,包括准备数据存放目录、创建用户、下载安装包、初始化数据库、配置服务脚本、设置环境变量等操作。
913 1

热门文章

最新文章