备案控制台

开发者社区人工智能文章正文

Abstractive Sentence Summarization with Attentive Recurrent Neural Networks 阅读笔记

2018-07-25 1543

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Abstractive Sentence Summarization with Attentive Recurrent Neural Networks

Sumit Chopra et al., Facebook AI Research
NAACL2016
sentence level
encoder: 使用了基于注意力的CNN
- 先将词的原始embedding(x_i)和位置embedding(l_i)（可训练）相加，作为词的full embedding(a_i)
- 然后使用size=5的一维卷积核做一个卷积操作，得到aggregate embedding(z_i)
- 计算attention：
h_t-1是t-1时刻的隐层状态（吧）
- 计算t时刻encoder的输出c_t:
decoder: 普通的RNN和LSTM都试了
- 状态更新：
模型encoder的输入每次都是一个完整地句子，decoder每次要输出的时候，会将h_t-1给encoder，encoder根据句子和h_t-1计算attention生成c_t给decoder，然后decoder根据(y_t-1, h_t-1, c_t)计算要输出的单词。encoder还要更新position embedding(l_i)
性能(RAS-Elman, k=10, k means beam size):
- DUC-2004: Rouge-1:28.97/Rouge-2:8.26/Rouge-L:24.06
- Gigaword: Rouge-1:33.78/Rouge-2:15.97/Rouge-L:31.15

文章标签：

机器学习/深度学习

sunshinebot

目录

相关文章

Trouble..

|

机器学习/深度学习算法

Keyphrase Extraction Using Deep Recurrent Neural Networks on Twitter论文解读

该论文针对Twitter网站的信息进行关键词提取，因为Twitter网站文章/对话长度受到限制，现有的方法通常效果会急剧下降。作者使用循环神经网络（recurrent neural network，RNN）来解决这一问题，相对于其他方法取得了更好的效果。

Trouble..

101 0 0

征途黯然。

|

机器学习/深度学习自然语言处理算法

【文本分类】Convolutional Neural Networks for Sentence Classification

【文本分类】Convolutional Neural Networks for Sentence Classification

征途黯然。

97 0 0

【文本分类】Convolutional Neural Networks for Sentence Classification

征途黯然。

|

机器学习/深度学习存储人工智能

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

97 0 0

【文本分类】Recurrent Convolutional Neural Networks for Text Classification

征途黯然。

|

机器学习/深度学习大数据

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

征途黯然。

144 0 0

【文本分类】Deep Pyramid Convolutional Neural Networks for Text Categorization

一个处女座的程序猿

|

机器学习/深度学习数据挖掘

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

一个处女座的程序猿

329 0 0

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

花海沙

|

机器学习/深度学习数据建模

2_Recurrent Neural Networks (RNNs)循环神经网络 —Simple RNNs

2_Recurrent Neural Networks (RNNs)循环神经网络 —Simple RNNs

花海沙

189 0 0

2_Recurrent Neural Networks (RNNs)循环神经网络 —Simple RNNs

致Great_VIP

|

机器学习/深度学习自然语言处理前端开发

《Reasoning about Entailment with Neural Attention》阅读笔记

《Reasoning about Entailment with Neural Attention》阅读笔记

致Great_VIP

160 0 0

《Reasoning about Entailment with Neural Attention》阅读笔记

一个处女座的程序猿

|

机器学习/深度学习数据挖掘计算机视觉

CV：翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第四章（一）

CV：翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第四章

一个处女座的程序猿

193 0 0

CV：翻译并解读2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》第四章（一）

一个处女座的程序猿

|

机器学习/深度学习存储文字识别

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读（一）

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

一个处女座的程序猿

299 0 0

一个处女座的程序猿

|

机器学习/深度学习传感器文字识别

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读（三）

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

一个处女座的程序猿

231 0 0

热门文章

最新文章

常见浏览器User-Agent大全

未来已来！阿里小蜜AI技术揭秘

Flink: 实时规则引擎助力新零售发展

Apache Flink 进阶（三）：Checkpoint 原理解析与应用实践

weex-html5 组件进阶

群智能算法：灰狼优化算法（GWO）的详细解读

Amazon 的IoT之路

hp M1530一体机无法在OEM系统下安装驱动

NumPy Cookbook 带注释源码十、Scikit 中的乐趣

潮流设计：15个创意的 3D 字体版式作品欣赏

springboot配置hosts文件

maven项目的pom.xml文件常用标签使用介绍

天气预报-腾讯天气-7天-地址查询版免费API接口

第四届人文，智慧教育与服务管理国际学术会议（HWESM 2025） 2025 4th International Conference on Humanities, Wisdom Education and Service Management

2025电气自动化与电机系统国际学术会议（EAMS 2025） 2025 International Conference on Electrical Automation and Motor System

大厂面试高频：什么是自旋锁？Java 实现自旋锁的原理？

C++ 之 perf+火焰图分析与调试

面试高频：Synchronized 原理，建议收藏备用！

SQL 中，通配符

鸿蒙next版开发：相机开发-适配不同折叠状态的摄像头变更(ArkTS)

相关课程

更多

机器学习小抄 | Machine Learning Cheat Sheets

相关电子书

更多

Understanding Recurrent Neural

Spiking Neural Networks, the N

Learning Disentangled Representations for Recommendation原文

下一篇

无影云桌面