X-GEAR:Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction

本文涉及的产品
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 我们提出了一项利用多语言预训练生成语言模型进行零样本跨语言事件论元抽取(EAE)的研究。通过将EAE定义为语言生成任务,我们的方法有效地编码事件结构并捕获论元之间的依赖关系。

Multilingual Generative Language Models for Zero-Shot Cross-Lingual Event Argument Extraction



论文:https://arxiv.org/pdf/2203.08308.pdf

代码:https://github.com/PlusLabNLP/X-Gear

期刊/会议:ACL 2022


摘要


我们提出了一项利用多语言预训练生成语言模型进行零样本跨语言事件论元抽取(EAE)的研究。通过将EAE定义为语言生成任务,我们的方法有效地编码事件结构并捕获论元之间的依赖关系。我们设计了与语言无关的模板(language-agnostic templates)来表示与任何语言兼容的事件论元结构,从而促进了跨语言迁移。我们提出的模型对预训练的多语言生成语言模型进行微调,以生成从输入段落中抽取的论元填充语言无关模板的句子。该模型在源语言上进行训练,然后直接应用于目标语言进行事件论元抽取。实验表明,该模型在零样本跨语言EAE方面优于现有的最先进模型。为了更好地理解使用生成语言模型进行零样本跨语言迁移EAE的优势和当前的局限性,本文进行了全面的研究和误差分析。


1、简介


事件论元抽取(EAE)旨在识别作为事件论元的实体,并识别它们对应的角色。如图1中的英文示例所示,给定Conflict:Attack事件的触发词“destroyed”,事件论元抽取器预计将“commando”、“Iraq”和“post”识别为事件论元,并分别预测它们的角色为“Attacker”、“Place”和“Target”。


a8bee9103ee640048c143a7b677da103.png


零样本跨语言EAE已经引起了相当大的关注,因为它消除了在低资源语言中构建EAE模型时对标记数据的需求(Subburathinam et al, 2019; Ahmad et al, 2021; Nguyen and Nguyen,2021)。在此设置中,模型使用源语言的示例进行训练,并直接在目标语言的实例上进行测试。


最近,基于生成的模型在单语言结构化预测任务上表现出了强大的性能(Yan et al, 2021; Huang et al, 2021b; Paolini et al, 2021),包括EAE(Li et al, 2021; Hsu et al, 2021)。这些工作对预训练的生成语言模型进行微调,以根据设计的模板生成输出,从而可以轻松地从输出中解码最终的预测。与传统的基于分类的模型相比(Wang et al, 2019; Wadden et al, 2019; Lin et al, 2020),它们更好地捕获实体之间的结构和依赖关系,因为模板提供了额外的声明性信息。


尽管取得了成功,但以往作品中的模板设计是语言依赖的,这使得它很难扩展到零样本跨语言迁移设置(Subburathinam et al, 2019;Ahmad et al, 2021)。简单地将这种在源语言上训练的模型应用于目标语言通常会产生 code-switching 输出,导致零样本跨语言的性能较差。如何为零样本跨语言结构化预测问题设计基于语言认知生成的模型仍然是一个悬而未决的问题。

在这项工作中,我们提出了一项研究,利用多语言预训练生成模型进行零样本跨语言事件论元抽取,并提出了X-GEAR(跨语言生成事件论元抽取器)。给定一个输入段落和一个精心设计的提示,提示包含一个事件触发词和相应的语言无关模板,训练X-GEAR生成一个句子,用论元填充语言无关模板。X-GEAR继承了基于生成的模型的优点,它比基于分类的模型更好地捕获事件结构和实体之间的依赖关系。此外,预训练的解码器固有地将命名实体识别为事件论元的候选,不需要额外的命名实体识别模块。与语言无关的模板可以防止模型过度拟合源语言的词汇表,并促进跨语言迁移。


我们在两个多语言EAE数据集上进行了实验:ACE-2005 (Doddington et al, 2004)和ERE (Song et al, 2015)。结果表明,X-GEAR的性能优于目前最先进的零样本跨语言EAE模型。我们进一步进行了消融研究,以证明我们的设计是正确的,并提出了全面的错误分析,以了解使用多语言基于生成的模型进行零样本跨语言迁移的局限性。


2、相关工作


零样本跨语言结构预测。零样本跨语言学习是一个新兴的研究主题,因为它消除了低资源语言训练模型对标记数据的需求(Ruder et al, 2021; Huang et al, 2021a)。研究了五种不同的结构化预测任务,包括命名实体识别(Pan et al, 2017; Huang et al, 2019; Hu et al, 2020),依赖解析(Ahmad et al, 2019b,a; Menget al, 2019),关系抽取(Zou et al, 2018; Ni and Florian, 2019),以及事件论元抽取(Subburathinam et al, 2019; Nguyen and Nguyen, 2021; Fincke et al, 2021)。其中大多数是基于分类的模型,在预先训练的多语言掩码语言模型之上构建分类器。为了进一步处理语言之间的差异,其中一些需要额外的信息,如双语词典(Liu et al, 2019; Ni and Florian, 2019),翻译对(Zou et al, 2018)和依赖解析树(Subburathinam et al, 2019; Ahmad et al, 2021; Nguyen and Nguyen, 2021)。然而,正如之前的文献所指出的(Li et al, 2021; Hsu et al, 2021),与基于生成的模型相比,基于分类的模型在建模实体之间的依赖关系方面不太强大。


基于生成结构预测。一些工作已经证明了基于代的模型在单语言结构化预测任务上的巨大成功,包括命名实体识别(Yan et al, 2021),关系抽取(Huang et al, 2021b;Paolini et al,2021)和事件抽取(Du et al,2021;Li et al, 2021;Hsu et al, 2021;Lu et al, 2021)。如第1节所述,其设计的生成目标是语言相关的。因此,直接将他们的方法应用于零样本跨语言设置将导致不太理想的性能。


提示的方法。最近,人们越来越有兴趣在预先训练的语言模型上加入提示,以指导模型的行为或引出知识(Peng et al, 2019; Sheng et al, 2020; Shin et al, 2020; Schick and Schütze, 2021; Qin and Eisner, 2021; Scao and Rush, 2021)。根据(Liu et al, 2021)中的分类法,可以根据语言模型的参数是否调优以及是否引入了可训练的提示来对这些方法进行分类。我们的方法属于修复提示和调整语言模型参数的类别。尽管对提示方法的研究蓬勃发展,但对多语言任务的关注有限(Winata et al, 2021)。


3、零样本跨语言事件论元抽取


image.png

9cb0dbe09309453e8d8ba5505734226d.png


与单语言EAE类似,零样本跨语言EAE模型被期望能够捕获论元之间的依赖关系并进行结构化预测。然而,与单语言EAE不同的是,零样本跨语言EAE模型需要处理语言之间的差异(例如,语法,词序),并学习将知识从源语言转移到目标语言。


4、X-GEAR模型


我们将零样本跨语言EAE作为一个语言生成任务,并提出X-GEAR,一个跨语言生成事件论元抽取器,如图2所示。这种表述提出了两个挑战:(1)在训练和测试过程中,输入语言可能会发生变化;(2)生成的输出字符串需要很容易地解析成最终的预测。因此,输出字符串必须相应地反映输入语言的变化,同时保持良好的结构。


我们通过设计与语言无关的模板来解决这些挑战。具体来说,给定一个输入段落x xx和一个设计的提示,其中包含给定的触发词t tt、事件类型e ee和一个语言无关的模板,X-GEAR学习生成一个输出字符串,用从输入段落中抽取的信息填充语言无关的模板。语言无关的模板是以结构化的方式设计的,因此从生成的输出中解析最终论元预测a aa和角色预测r rr是非常简单的。此外,由于模板与语言无关,因此便于跨语言迁移。


X-GEAR微调多语言预训练生成模型,如mBART-50 (Tang et al, 2020)或mT5 (Xue et al, 2021),并使用复制机制增强它们,以更好地适应输入语言的变化。我们将其详细信息如下所示,包括语言无关的模板、目标输出字符串、输入格式和训练细节。


4.1 语言无关的模板


我们为每个事件类型e ee创建一个与语言无关的模板T e,在其中列出所有可能关联的角色,并为该事件类型e ee形成一个唯一的html标记样式模板。例如,在图2中,Life:Die事件与四个角色关联:Agent, Victim, Instrument, and Place。因此,Life:Die事件的模板被设计为:


<Agent>[None]</Agent><Victim>[None]</Victim><Instrument>[None]</Instrument><Place>[None]</Place>.


为了便于理解,我们使用英语单词来表示模板。然而,这些token([None], <Agent>, </Agent>, <Victim>,...)被编码为特殊的token,预训练的模型从未见过,因此需要从头开始学习它们的表示。由于这些特殊的符号与任何语言都没有关联,也没有预先训练过,所以它们被认为是语言无关的。


4.2 目标输出格式


X-GEAR学习生成遵循语言无关模板形式的目标输出字符串。为了组成用于训练的目标输出字符串,给定一个实例(x,t,e,a,r),我们首先为事件类型e挑选出语言无关的模板T e,然后根据它们的角色r 将T e 中的所有“[None]”替换为a中相应的论元。如果一个角色有多个论元,我们用一个特殊的标记“[and]”连接它们。例如,图2中的训练示例为Victim角色提供了两个论元(civilian和woman),输出字符串的相应部分为


<Victim> civilians [and] woman </Victim>.


如果一个角色没有对应的论元,则在T e  中保留“[None]”。通过应用此规则,图2中训练示例的完整输出字符串变成


<Agent> coalition </Agent><Victim> civilians [and] woman </Victim><Instrument> missile </Instrument><Place> houses </Place>.


由于输出字符串是html标记样式的,我们可以通过一个简单的基于规则的算法从生成的输出字符串中轻松解码论元和角色预测。


4.3 输入格式


如前所述,零样本跨语言EAE生成公式的关键是引导模型以所需的格式生成输出字符串。为了促进这种行为,我们将输入段落x 和提示符供给X_GEAR,如图2所示。提示包含所有触发词t 和语言无关模板T e 。注意,我们没有显式地在提示符中包含事件类型e,因为模板T e 隐式地包含此信息。在6.1节中,我们将展示显式地在提示符中添加事件类型e 的实验,并讨论它对跨语言迁移的影响。


4.4 训练


为了使X-GEAR能够生成不同语言的句子,我们将多语言预训练的生成模型作为我们的基础模型,该模型模拟了生成一个新token的条件概率,给定先前生成的标记和编码器c 的输入上下文,

image.png


5、实验


数据集:ACE-2005,ERE。


基线模型:OneIE,CL-GCN,GATE,TANL。


实验结果:


fee2d1be74c741789481c0d5e9465f0f.png

6abc0e588f7047539a37f3196c6ebab9.png


表1和表2展示了各种基线模型在两种数据集上的实验效果。具有以下结论:


  • 1.和先前的生成模型对比:TANL模型采用语言依赖的模板,很容易生成code-switching输出,这种模板预训练语言模型已经看过,导致了差的性能。X-GEAR语言无关的模板解决了这一现状。


  • 2.和分类模型对比:OneIE、CL-GCN和GATE,三种模型需要格外管道式的命名实体识别模块,后面两者还需要额外的依赖解析标注去对其不同语言的表征。X-GEAR不需要额外的模块和标注。


  • 3.和不同的预训练生成模型的对比:mT5-base和mBERT-50-large参数量基本相同,但效果更佳,原因可能在于使用了特殊的token带来了不同。mBERT-50使用begin-of-sequence(BOS) token,当使用时必须先制定BOS token作为开始。而mT5-base则没有这种限制。


  • 4.大的预训练语言模型效果可能更好。


6、结论


我们提出了第一个基于生成的的零样本跨语言事件论元抽取模型。为了克服语言之间的差异,我们设计了与语言无关的模板,并提出了X-GEAR,它可以很好地捕获输出依赖关系,并且可以在没有额外的命名实体抽取模块的情况下使用。我们的实验结果表明,X-GEAR优于目前最先进的技术,这证明了使用语言生成框架解决零样本跨语言结构化预测任务的潜力。

目录
相关文章
|
数据挖掘
【提示学习】Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot Classification
文章提出了一种简单确高效地构建verbalization的方法:
|
7月前
|
Python
[UNILM]论文实现:Unified Language Model Pre-training for Natural Language.........
[UNILM]论文实现:Unified Language Model Pre-training for Natural Language.........
44 0
|
自然语言处理 算法
SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model
在社交媒体上,面临着大量的知识和信息,一个有效的关键词抽取算法可以广泛地被应用的信息检索和自然语言处理中。传统的关键词抽取算法很难使用外部的知识信息。
162 0
SIFRank New Baseline for Unsupervised Keyphrase Extraction Based on Pre-Trained Language Model
|
机器学习/深度学习 自然语言处理 算法
TASLP21-Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations
事件抽取是自然语言处理的一项基本任务。找到事件论元(如事件参与者)的角色对于事件抽取至关重要。
102 0
|
机器学习/深度学习 人工智能 自然语言处理
OneIE:A Joint Neural Model for Information Extraction with Global Features论文解读
大多数现有的用于信息抽取(IE)的联合神经网络模型使用局部任务特定的分类器来预测单个实例(例如,触发词,关系)的标签,而不管它们之间的交互。
193 0
|
自然语言处理 数据挖掘 数据处理
【提示学习】Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
目前流行的第四大范式Prompt的主流思路是PVP,即Pattern-Verbalizer-Pair,主打的就是Pattern(模板)与Verbalizer(标签映射器)。   本文基于PVP,提出PET与iPET,但是关注点在利用半监督扩充自己的数据集,让最终模型学习很多样本,从而达到好效果。
116 0
|
数据挖掘
【提示学习】Prompt Tuning for Multi-Label Text Classification: How to Link Exercises to Knowledge Concept
文章这里使用的是BCEWithLogitsLoss,它适用于多标签分类。即:把[MASK]位置预测到的词表的值进行sigmoid,取指定阈值以上的标签,然后算损失。
【COT】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
【COT】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
248 0
|
机器学习/深度学习 自然语言处理 算法
Retrieval-Augmented Generative Question Answering for Event Argument Extraction论元解读
长期以来,事件论元抽取一直被研究为基于抽取的方法的序列预测问题,孤立地处理每个论元。尽管最近的工作提出了基于生成的方法来捕获交叉论元依赖性,但它们需要生成和后处理复杂的目标序列(模板)。
176 0
|
自然语言处理 算法
Prompt for Extraction? PAIE: Prompting Argument Interaction for Event Argument Extraction 论文解读
在本文中,我们提出了一个既有效又高效的模型PAIE,用于句子级和文档级的事件论元抽取(EAE),即使在缺乏训练数据的情况下也能很好地泛化。
139 0