TextCNN、DCNN、AttentionXML…你都掌握了吗?一文总结文本分类必备经典模型(三)

简介: TextCNN、DCNN、AttentionXML…你都掌握了吗?一文总结文本分类必备经典模型

二、Attention

CNN和RNN在文本分类任务中表现出色。然而,这些模型不够直观,可解释性差,特别是在分类错误中,由于隐藏数据的不可读性而无法解释。随后,基于注意力的方法被成功地应用于文本分类中。基于注意力的模型架构如图8。注意力机制让模型对特定的输入给予不同的注意。它首先将重要的词聚集成句子向量,然后将重要的句子向量聚集成文本向量。它可以了解每个词和句子对分类判断的贡献有多大,这有利于通过两个层次的关注进行应用和分析。


图8 注意力机制架构


2.1 AttentionXML

AttentionXML是针对多标签分类(XML)问题引入注意力机制,文章发表在 NeurIPS 2019中 。本文提出一种基于树结构的模型,即probabilistic label tree (PLT),来解决标签数量大的问题。

XML-CNN的方法是将所有的labels看作平行结构,类似one-hot,这样导致所有的label都基于一个共同的表征向量来学习预测。PLT是一棵有L个叶子的树,每个叶子都对应着一个原始标签。首先将label文本用特征向量表示,然后用递归聚类构建label tree,生成的树结构,叶子节点是真实标签,非叶子节点是伪标签。本文对PLT做了改进,构建了一个较浅并且很宽的树结构。

AttentionXML的过程如图9所示:(1) 给PLT中每一个level训练一个模型;(2) 从d-1层选出TOP c个标签作为下一层训练的候选标签,以d-1层训练得到的权重作为以d层训练的初始化;(3) 用d层训练好的模型,只预测属于d-1层TOP c节点中的子节点。

图9 用于多标签文本分类任务的基于标签树的深度模型Attention XML。(a) AttentionXML中使用的PLT的例子。(b) PLT构建过程的一个例子,设置为K=M=8=23,H=3,L=8000。从左到右的数字表示从上到下每一层的节点。红色的数字表示为了得到T_h+1而被删除的T_h中的节点。(c) 在AttentionXML中,以文本(长度Tˆ)为输入,以预测分数zˆ为输出的注意力感知深度模型的概述


当前 SOTA!平台收录 AttentionXML 共 1 个模型实现资源。


模型 SOTA!平台模型详情页
AttentionXML 前往 SOTA!模型平台获取实现资源:https://sota.jiqizhixin.com/models/models/839883d4-569c-4d5c-9457-e5a374375875

前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及API等资源。

网页端访问:在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ,即可前往「SOTA!模型」平台,查看关注的模型是否有新资源收录。

移动端访问:在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」,关注 SOTA!模型服务号,即可通过服务号底部菜单栏使用平台功能,更有最新AI技术、开发资源及社区动态定期推送。

相关文章
【汉诺塔】经典递归问题(Java实现)图文并茂讲解
【汉诺塔】经典递归问题(Java实现)图文并茂讲解
|
消息中间件 弹性计算 Kubernetes
RabbitMQ与容器化技术的集成实践
【8月更文第28天】RabbitMQ 是一个开源消息代理和队列服务器,用于在分布式系统中存储、转发消息。随着微服务架构的普及,容器化技术(如 Docker 和 Kubernetes)成为了部署和管理应用程序的标准方式。本文将探讨如何使用 Docker 和 Kubernetes 在生产环境中部署和管理 RabbitMQ 服务,同时保证高可用性和弹性伸缩能力。
391 3
|
监控 Python
推荐一些Python的内存分析工具。
【2月更文挑战第7天】【2月更文挑战第19篇】推荐一些Python的内存分析工具。
1674 1
|
负载均衡 监控 开发者
深入浅出:掌握 Docker Compose 的高级用法
【10月更文挑战第22天】本文深入探讨了 Docker Compose 的高级用法,包括环境变量、服务扩展、网络配置和数据卷管理。通过实例详细介绍了如何利用这些功能提升开发效率和应用部署的灵活性。适合希望深入了解 Docker Compose 的开发者阅读。
|
存储 SQL 分布式计算
湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
【10月更文挑战第7天】湖仓一体架构深度解析:构建企业级数据管理与分析的新基石
906 1
|
Ubuntu Linux
服务器硬件 做raid操作 ubuntu linux做raid
服务器硬件 做raid操作 ubuntu linux做raid
364 0
|
数据安全/隐私保护
阿里云商标注册流程
很多用户有注册商标的需求,又不知道怎么注册商标。特别是他们想在阿里云注册商标,其实注册商标很简单。商标类型,又分为:文字商标,图形商标,文字图形组合商标。无论你在阿里云是要买域名,买服务器,还是干嘛,首先你都需要注册阿里云账号的。
|
编解码 Python
问题解决:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 0: invalid continuation by
问题解决:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 0: invalid continuation by
4079 0
问题解决:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcf in position 0: invalid continuation by
|
传感器 存储 编解码
STM32入门开发: 编写DS18B20温度传感器驱动(读取环境温度、支持级联)
STM32入门开发: 编写DS18B20温度传感器驱动(读取环境温度、支持级联)
1805 0
STM32入门开发: 编写DS18B20温度传感器驱动(读取环境温度、支持级联)
|
存储 供应链 数据可视化
一文带你认识医院信息化必备系统HIS、CIS、LIS、EMR、PACS、RIS等
医院信息系统的发展趋势是将各类医疗器械直接联机并将附近各医院乃至地区的医院信息系统联成网络。其中最关键的问题是使不同系统中的病历登记、检测、诊断指标等都要标准化。医院信息系统的高级阶段将普遍采用医疗专家系统,建立医疗质量监督和控制系统,进一步提高医疗水平和保健水平。
7719 0
一文带你认识医院信息化必备系统HIS、CIS、LIS、EMR、PACS、RIS等