CopyNet 阅读笔记

简介:

Incorporating copying mechanism in sequence-to-sequence learning

  • Jiatao GU et al.
  • ACL2016
  • using LCSTS Dataset
  • Models

    • 整体: CopyNet
    • Prediction: 相比上一个有个开关的方式,这篇论文则将概率相加再softmax得到输出。对于V中的每个词,计算generation模式的概率,对于X中的每个词,计算copy模式的概率,最后进行归一化,得到输出。
      CopyNet_Prediction
    • Decoder State Update: s_t=f(s_t-1, y_t-1, c_t)这个和常规的是一样的,但是这里的y_t-1=[e(y_t-1), C(y_t-1)]T,e就是y_t-1的embedding,C是输入单词的权重,对跟y_t-1相同的词进行计算,不相同的词直接置0,然后归一化。
  • Code: https://github.com/MultiPath/CopyNet
  • 性能:

    • LCSTS(Word Level): Rouge-1:35.0/Rouge-2:22.3/Rouge-L:32.0

Sequential Copying Networks

  • Qingyu Zhouy, Nan Yang, Furu Wei, Ming Zhou; HIT & MSRA
  • AAAI2018
  • 原先的CopyNet每次copy一个词,这篇文章一次可以copy多个词(词组),通过给每个copy的词打标签来判断是否结束
  • 性能

    • Gigaword: Rouge-1:35.93/Rouge-2:17.51/Rouge-L:33.35
目录
相关文章
|
4月前
|
存储 算法 程序员
|
6月前
|
人工智能 Unix 开发工具
vimtutor阅读笔记
csdn博客搬运 vim 常用操作
54 0
|
机器学习/深度学习 编解码 算法
DGP 论文阅读笔记
DGP 论文阅读笔记
240 0
DGP 论文阅读笔记
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(二)
StackGAN 论文阅读笔记(二)
82 0
StackGAN 论文阅读笔记(二)
|
机器学习/深度学习 编解码 监控
BigGAN-论文阅读笔记
BigGAN-论文阅读笔记
226 0
BigGAN-论文阅读笔记
|
机器学习/深度学习 编解码 计算机视觉
StackGAN 论文阅读笔记(三)
StackGAN 论文阅读笔记(三)
101 0
StackGAN 论文阅读笔记(三)
|
机器学习/深度学习 编解码 自然语言处理
StackGAN 论文阅读笔记(一)
StackGAN 论文阅读笔记(一)
95 0
StackGAN 论文阅读笔记(一)
|
算法
《趣学算法》阅读笔记(一)
《趣学算法》阅读笔记(一)
105 0
《趣学算法》阅读笔记(一)
|
机器学习/深度学习 算法
《趣学算法》阅读笔记(二)
《趣学算法》阅读笔记(二)
131 0
《趣学算法》阅读笔记(二)
|
编译器 C++
C++ Primer 阅读笔记(一)
C++ Primer 阅读笔记(一)
C++ Primer 阅读笔记(一)
下一篇
无影云桌面