备案控制台

开发者社区人工智能文章正文

A Neural Attention Model for Abstractive Sentence Summarization 阅读笔记

2018-07-25 2292

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： A Neural Attention Model for Abstractive Sentence Summarization 阅读笔记

A Neural Attention Model for Abstractive Sentence Summarization

Alexander M. Rush et al., Facebook AI Research/Harvard
EMNLP2015
sentence level
seq2seq模型在2014年提出，这篇论文是将seq2seq模型应用在abstractive summarization任务上比较早期的论文。同组的人还发表了一篇NAACL2016（Sumit Chopra, Facebook AI Research_Abstractive sentence summarization with attentive recurrent neural networks）（作者都差不多），在这篇的基础上做了更多的改进，效果也更好。这两篇都是在abstractive summarization任务上使用seq2seq模型的经典baseline。
目标函数是negative log likelihood，使用mini-batch SGD优化
本文提出了3种encoder，重点在于Attention-based encoder
- bag-of-words encoder
- Conv encoder: 参考TextCNN，没有做过多的其他改动
- Attention-based encoder:
  x: 原始文本
y_c: 上下文单词（已经输出的摘要内容）
生成摘要使用Beam Search算法
本模型效果并不让人满意
性能(ABS)
- DUC-2004: Rouge-1:26.55/Rouge-2:7.06/Rouge-L:22.05
- Gigaword: Rouge-1:30.88/Rouge-2:12.65/Rouge-L:28.34

文章标签：

算法

sunshinebot

目录

相关文章

BetterBench

|

3月前

|

机器学习/深度学习 PyTorch 语音技术

【文献学习】Conformer: Convolution-augmented Transformer for Speech Recognition

文章介绍了Conformer模型，这是一种结合了Transformer的自注意力机制和CNN卷积模块的混合模型，旨在提高语音识别任务的性能，通过自注意力捕捉全局上下文信息，同时利用卷积模块有效捕获局部特征。

BetterBench

70 0 0

Bigcrab__

|

6月前

|

机器学习/深度学习自然语言处理并行计算

[Bert]论文实现：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

[Bert]论文实现：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

Bigcrab__

76 1 1

Trouble..

|

机器学习/深度学习自然语言处理数据可视化

SimCSE: Simple Contrastive Learning of Sentence Embeddings论文解读

本文介绍了SimCSE，一个简单的对比学习框架，极大地推进了最先进的句子嵌入。我们首先描述了一种无监督方法，该方法采用一个输入句子，并在一个对比目标中预测自己

Trouble..

282 0 0

Trouble..

|

机器学习/深度学习编解码自然语言处理

DeIT:Training data-efficient image transformers & distillation through attention论文解读

最近，基于注意力的神经网络被证明可以解决图像理解任务，如图像分类。这些高性能的vision transformer使用大量的计算资源来预训练了数亿张图像，从而限制了它们的应用。

Trouble..

521 0 0

征途黯然。

|

机器学习/深度学习数据挖掘

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

征途黯然。

194 0 0

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

征途黯然。

|

机器学习/深度学习自然语言处理大数据

【文本分类】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

【文本分类】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

征途黯然。

138 0 0

【文本分类】BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

征途黯然。

|

机器学习/深度学习自然语言处理算法

【文本分类】Convolutional Neural Networks for Sentence Classification

【文本分类】Convolutional Neural Networks for Sentence Classification

征途黯然。

97 0 0

【文本分类】Convolutional Neural Networks for Sentence Classification

征途黯然。

|

机器学习/深度学习大数据

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

征途黯然。

144 0 0

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

征途黯然。

|

机器学习/深度学习存储人工智能

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

97 0 0

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

|

机器学习/深度学习自然语言处理数据挖掘

【文本分类】A C-LSTM Neural Network for Text Classification

【文本分类】A C-LSTM Neural Network for Text Classification

征途黯然。

146 0 0

【文本分类】A C-LSTM Neural Network for Text Classification

热门文章

最新文章

常见浏览器User-Agent大全

未来已来！阿里小蜜AI技术揭秘

Flink: 实时规则引擎助力新零售发展

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

weex-html5 组件进阶

群智能算法：灰狼优化算法（GWO）的详细解读

Amazon 的IoT之路

hp M1530一体机无法在OEM系统下安装驱动

NumPy Cookbook 带注释源码十、Scikit 中的乐趣

潮流设计：15个创意的 3D 字体版式作品欣赏

springboot配置hosts文件

maven项目的pom.xml文件常用标签使用介绍

天气预报-腾讯天气-7天-地址查询版免费API接口

第四届人文，智慧教育与服务管理国际学术会议（HWESM 2025） 2025 4th International Conference on Humanities, Wisdom Education and Service Management

2025电气自动化与电机系统国际学术会议（EAMS 2025） 2025 International Conference on Electrical Automation and Motor System

大厂面试高频：什么是自旋锁？Java 实现自旋锁的原理？

C++ 之 perf+火焰图分析与调试

面试高频：Synchronized 原理，建议收藏备用！

SQL 中，通配符

鸿蒙next版开发：相机开发-适配不同折叠状态的摄像头变更(ArkTS)

相关电子书

更多

Understanding and Improving Layer Normalization论文

DEGREE: Deep Learning For Graph Embedding

Investigation of Transformer based Spelling Correction Model for CTC-based End-to-End Mandarin Speech Recognition

下一篇

无影云桌面