任务驱动型人机对话|学习笔记

简介: 快速学习任务驱动型人机对话

开发者学堂课程【达摩院智能语音交互 - 人机对话技术浅析任务驱动型人机对话】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/854/detail/14077


任务驱动型人机对话


内容介绍:

一、任务驱动型人机对话的流程

二、自然语言理解

三、NLU 常用神经网络方法


一、任务驱动型人机对话的流程

任务驱动型人机对话一般使用如下流程框图:

image.png

1.第一步

首先,用户给出一条自然语言的指令,如果这个指令是通过语言给出的,那么人机系统入口前会接一个 ASR 的语音识别系统,把语音转换成文字,文字会通过自然语言理解(NLU)模块,它的功能是识别输入话语的领域和意图,获得任务相关的语义信息。

NLU 模块会识别出电影领域,然后意图是寻找电影,其中的演员是 Bill Murray。

2.第二步

然后这些信息流会进入对话管理模块(DM),DM 模块包括对话状态追踪(DST)和对话决策(DP)模块,对话管理的作用是控制人机对话的过程,DM根据对话的历史信息决定对用户的反应,其中的对话状态追踪模块负责更新对话状态如 LU 模块的输出和用户特征等,对话决策模块则是基于当前对话状态,选择接下来合适的动作。

3.第三步

一般来说,对话管理常常涉及与领域相关的知识库的交互,

在这个地址里面,机器会在知识库里查找 Bill Murray ,并发现 Bill Murray 其实出演过很多部电影,因此,对话管理模块会做出一个请求电影发行年份的动作。

工业界中对话管理模块的主流方法一般是基于其它式的方法,虽然在学术界还在积极探索基于神经网络的对话管理的方法,但是这些都还不成熟,需要不断发展。

4,第四步

接下来电影的动作会通过自然语言生成(NLG)模块生成自然语言的语句,发现电影是什么时候发行。其中,NLG 有基于模板的方法,也有基于神经网络的方法,最后通过 GTS 的语音合成系统,把文字转成语音,和人类进行交互。综合以上,从 NLU DM 再到 NLG ,组成了一个完整的任务驱动型人机对话的流程。


二、自然语言理解(NLU)

自然语言理解主要分为三个类型

1.领域分类Domain Classification

指把用户输入的智能语言语句划分到某个特定的领域,如:电影,餐馆航班等领域,不同的领域会对接不同的知识库,比如电影领域后面会接一个电影相关的知识库。

2.意图分类 Intent Classification

指把用户的语句划分到某个意图上,如航班领域中的航班时间,机票费用,地面服务等意图。

3.槽填充Slot Filling 分类

指在某些槽内填上对应的槽值,如出发城市是一个槽,对应的槽值是杭州,出发月份也是一个槽,槽值是

4.示例

假设用户自然语言输入:杭州机场有什么地面交通?

NLU 模块把它划分到航班的领域,意图是地面服务,然后给城市名这个槽打上杭州的槽值,即槽填空分类是城市名=“杭州”。


三、NLU 常用神经网络方法

1.领域分类

常用的领域分类有:CNN,LSTM, Transformer

2.意图分类

常用的意图分类有:CNN,LSTM, Transformer

3.槽填充

槽填充问题一般会被当作一个序列标注的问题,也就是给输入的语句的序列打上标签,例如:哪些是城市名?哪些是什么都不属于?常见的方法有:Sequence labeling approachesBiLSTM+CRFTransf ormer

4.流水线pipeline

经典的 NLU 模块采用流水线的模式,即按照:领域分类->意图分类->槽填充的顺序进行。

5.为什么不联合意图分类和槽填充?

近年来,业界也关注到了这个问题,2016年的 Sequence-based Parallel 的方法都尝试把意图分类和槽填充联合到一起。

Sequence-based(Hakkani-Tur et al.,2016),Parallel(Liu and Lane,2016)

1)BERT 联合建模意图分类和槽填充

①依据论文:BERT for Joint Intent Classification and

Slot Filling (Chen et al.,2019)

②优点一 :可以通过预训练 BERT 缓解对话标注数据稀少造成的泛化能力较弱问题。

③优点二 :巧妙地利用 BERT 结构联合建模意图分类和槽填充。

④优点三 :可以在两个benchmark获得 SOTA,在两个公开的标准的数据集上达到了最好的性能。

方法及原理如下图所示:

image.png

Figue 1: A high-level view of the proposed model.

The input query is “piay the song little robin redbreast”.

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
浅析人机对话系统的主要模块及核心技术
之前,在我的另一篇博客:简述智能对话系统 里面概述了对话系统的分类、应用场景及产生的社会价值。今天,来简单讲述一下对话系统的主要模块与核心技术。
|
搜索推荐 前端开发 架构师
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
2941 0
阿里高级技术专家谈开源DDD框架:COLA4.0,分离架构和组件(上)
|
10月前
|
机器学习/深度学习 自动驾驶 计算机视觉
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 GhostNet V1 基于 Ghost Module 和 Ghost Bottlenecks的轻量化网络结构
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 GhostNet V1 基于 Ghost Module 和 Ghost Bottlenecks的轻量化网络结构
851 13
|
Java Android开发 UED
安卓应用开发中的内存管理优化技巧
在安卓开发的广阔天地里,内存管理是一块让开发者既爱又恨的领域。它如同一位严苛的考官,时刻考验着开发者的智慧与耐心。然而,只要我们掌握了正确的优化技巧,就能够驯服这位考官,让我们的应用在性能和用户体验上更上一层楼。本文将带你走进内存管理的迷宫,用通俗易懂的语言解读那些看似复杂的优化策略,让你的开发之路更加顺畅。
357 33
|
存储 安全 机器人
MemoryScope:为LLM聊天机器人配备的长期记忆系统
如何选择合适的方法构建自己的智能体助理呢?这里向您介绍强大、低延迟、安全可控的MemoryScope开源项目。
|
搜索推荐 数据可视化 数据挖掘
会展中心定位导航:精准展位指引,提升用户参馆体验,增加企业成交机会!
在数字化时代,会展中心借助物联网、大数据与AI技术,推出了智能定位导航系统,革新参会体验。展前通过线上展位预约和可视化招商地图,简化招商流程,提高展位分配效率。展会期间,利用精准定位技术,实现一键导航,同时提供个性化展位推荐,增强参观效率与满意度。系统还支持位置分享、车位检索等功能,并通过数据分析为决策提供支持,全面提升会展品牌形象与竞争力。
385 0
会展中心定位导航:精准展位指引,提升用户参馆体验,增加企业成交机会!
|
自然语言处理 JavaScript 机器人
简单对话场景搭建和云小蜜接口集成 | 学习笔记
简介:快速学习简单对话场景搭建和云小蜜接口集成
632 0
简单对话场景搭建和云小蜜接口集成 | 学习笔记
|
存储 搜索推荐 前端开发
基于状态机的聊天机器人设计经验总结
为了更好地了解智能机器人项目的需求和改进方向,我们常常需要研发一些工具。在我参与的多个机器人项目中,大多数都能够成功地满足产品需求。通过这些实践,我们深刻认识到,如果要不断进步和提高,就必须对现有的机器人定义语言进行重大的改进。 • 简化需要复杂对话流程的机器人的创建过程。 • 最大限度地提高可重用性,通过重用过去已经定义过的模块和对话路径来创建机器人 在传统的做法中,完成这些并不容易,因为意图定义与部分排序约束混合在一起,限制了对话路径的自由度。这对于处理“开放式”机器人(常见于FAQ样式的机器人),其中大多数问题是独立的且始终可用的,这已经足够了。
369 0
|
Java 数据库连接 数据库
Spring boot+jpa根据实体类自动创建数据表
Spring boot+jpa根据实体类自动创建数据表
1303 0
Spring boot+jpa根据实体类自动创建数据表
|
网络协议 物联网 测试技术
如何发起 MQTT 亿级连接和千万消息吞吐性能测试
MQTT 协议凭借简单易实现、支持 QoS、报文小等特点,占据了物联网协议的半壁江山。
699 0
如何发起 MQTT 亿级连接和千万消息吞吐性能测试