论文标题:Towards Propagation Uncertainty: Edge-enhanced Bayesian Graph Convolutional Networks for Rumor Detection
论文链接:https://arxiv.org/abs/2107.11934
论文来源:ACL 2021
一、概述
现有的一些方法将谣言的传播结构构建成图,然后基于回复或转发关系来聚合邻域特征。然而,在信息传播的过程中,这些关系都被视为可信赖的边。如下图所示,一些不准确的关系(举例来说,有些回复可能与事实无关,比如一些小广告什么的)为谣言的传播结构带来了不确定性(uncertainty):
example
对不可信赖关系的忽略将导致多层信息传播过程中的误差累积从而限制有效特征的学习。我们从两个方面论证了传播结构中这种固有的不确定性是不可避免的:
①在现实世界中,谣言的制造者总是狡猾的,他们倾向于恶意操纵他人,创建虚假的支持推文,或删除反对的声音,以逃避检测;
②对传播关系的一些标注是主观的和破碎的,可用的图将是真实传播结构的一部分,同时也包含噪声关系,从而产生不确定性。
为此本文提出了EBGCN(Edge-enhanced Bayesian Graph Convolutional Network)来处理传播结构中的不确定性。EBGCN的核心思想是根据观测图的先验信念(prior belief)自适应地控制消息传递,以替换传播图中的固定边权值。在每次迭代中,根据观察图中节点特征的先验信念,由隐关系(latent relation)的后验分布推断边的权值。然后,利用图卷积层,通过聚合重构边上的邻域信息来聚合节点特征。通过上述方式,EBGCN可以处理传播结构中的不确定性并且提高谣言检测的鲁棒性。
另外,由于训练时缺少一些关系,或者一些关系是不准确的,我们设计了一种边一致性训练框架(edge-wise consistency training framework)。该框架将对这些未标注关系的无监督一致性训练结合到对标注样本的有监督训练中,以促进更好的学习。我们进一步通过计算两种分布之间的KL散度来保证边的隐分布和节点特征在观测图中的分布的一致性。
二、问题陈述
- 问题陈述
三、方法
- 概述
下图展示了EBGCN的大体架构:
框架
模型的输入为claim的文本内容和传播结构,我们首先将传播结构构建成两个相反边方向的图,分别是top-down的传播图和bottom-up的扩散图。文本内容通过文本embedding层编码成embedding向量。然后我们通过两个主要模块——节点更新模块和边推理模块来迭代地捕获丰富的结构信息,接着聚合节点特征生成图embedding,最终输出claim的预测标签。
训练时通过未标注隐关系的反向传播损失来结合贝叶斯的无监督一致性训练,也就是通过最小化无监督和有监督损失的加权累加来优化模型。
- EBGCN
- 图形构造与文本embedding
- 节点更新(Node Update)
- 边推理(Edge Inference)
- 分类
是一个权衡因子。
四、实验
- 数据集
数据集采用Twitter15,Twitter16和PHEME数据集,统计情况如下:
数据集
- 实验结果
对比了多个baseline方法:
实验结果
- 消融实验
探究了隐关系数量和损失权衡因子的影响:
消融实验
- 早期谣言检测
探究了早期谣言检测的性能:
早期谣言检测
- 例子
下图展示了一个假谣言的例子,通过边推理过程,一些无关的边的权重被缩小了:
example