论文标题:Rumor Detection on Social Media with Bi-Directional Graph Convolutional Networks
论文链接:https://arxiv.org/abs/2001.06362
论文来源:AAAI 2020
一、概述
传统的谣言检测方法缺乏从谣言的传播(propagation)和扩散(propagation)结构中学习的高层表示。最近的研究已经开始从谣言的传播结构中学习高层表示,比如RvNN等方法。然而这些方法只关注谣言的传播却忽略了谣言扩散的影响。虽然一些方法已经开始尝试使用CNN来引入谣言扩散信息,但是基于CNN的方法只能捕获局部邻域的相关特征,却不能处理图或树结构中的全局结构关系,因此谣言扩散的全局结构特征在这些方法中被忽略了。事实上CNN也并非被设计用来从结构化的数据中学习高层特征,不过图卷积网络(Graph Convolutional Network,GCN)可以做到。
GCN已经在很多领域取得了成功,不过我们不能简单地将GCN应用到谣言检测任务上。如下图(a)所示,GCN,或者称为无向GCN(UD-GCN)聚合信息只依赖相关帖子的关系却丢失了贴子之间的顺序关系:
GCN
UD-GCN虽然可以处理谣言扩散的全局结构特征,但是忽略了谣言传播的方向。沿着关系链的深度传播与社区群体内部的广度扩散是谣言的连个主要特点,因此需要一个方法来同时处理这两种传播方式。
本文提出了Bi-GCN方法来同时处理谣言的传播与扩散。Bi-GCN同时在top-down和bottom-up的图结构上进行操作,具体的通过top-down GCN(TD-GCN)来处理谣言的传播,以及通过bottom-up GCN(BU-GCN)来处理谣言的扩散。如上图(b)(c)所示,TD-GCN从父亲节点到子节点前向传播信息来模拟谣言的传播,BU-GCN从节点的子节点聚合信息来表示谣言的扩散过程。
二、方法
- 问题陈述
- 图卷积网络
GCN的卷积操作被看做是一个消息传递(message-passing)的结构:
- Bi-GCN谣言检测模型
Bi-GCN的核心思想是学习谣言传播和扩散的高层表示,在本文中采用的GCN都是用两层上述图卷积层。下图展示了模型的整个流程,主要分为4步:
Bi-GCN
- 构建传播和扩散图
- 计算高层节点表示
- 根节点特征增强
- 谣言分类的传播和扩散表示
谣言的传播和扩散表示通过聚合TD-GCN和BU-GCN的节点表示来获得,采用mean-pooling的方式:
然后拼接这两个表示:
三、实验
- 数据集
在Weibo,Twitter15,Twitter16三个数据集上进行实验,数据集统计如下:
数据集
- 性能对比
以下是在三个数据集上的结果:
Twitter15和Twitter16
- 消融实验
对比不同架构和有无根节点特征增强对模型性能的影响:
消融实验
- 谣言早期检测
谣言传播的不同时期所达到的模型性能:
谣言早期检测