DGL为Amazon发布的图神经网络开源库(github)。支持tensorflow, pytorch, mxnet。
如何初始化一个图:
- 节点ID从0开始标号
- G = dgl.graph((us, vs)) 一系列点和边,us->vs
- G.add_nodes(n) 添加n个点
- G.add_edge(u, v)添加边u->v
- G.add_edges(u[s], v[s])添加边u[s]->v[s]
- 节点和边都可以具有特征数据,存储为键值对,键是可选的,值必须是张量
- G.ndata['x'] = th.zeros((3, 5)) 对所有节点都设置特征数据,名称为x
- G.ndata['y'] = th.randn(g.num_nodes(), 5) 不同名称的特征数据可以有不同形状
- G.nodes[[0, 2]].data['x'] = th.ones((2, 5)) 对节点0,2设置特征数据
消息传递范式:
- 边上计算:计算边信息(涉及消息函数)
- 消息函数:接受edges,成员包括src, dst, data,得到发出的信息
- 点上计算:汇总边信息,更新点信息(涉及聚合函数,更新函数
- 聚合函数: 节点有属性mailbox访问节点收到的信息,并进行聚合操作(min, max, sum等)
- 更新函数: 用聚合函数的结果对原特征进行更新
- 高级API
- update_all: 接受一个消息函数,一个聚合函数,一个更新函数
- 高效的消息传递代码
- 实现细节避免消耗大量内存: 大矩阵乘法分拆
- 在图的一部分上进行消息传递:用想囊括的节点创建一个子图
顶层提供对不同业务抽象
Backend层: 实现多后端适配
Platform层:适配不同架构,支持高效计算
Platform层:适配不同架构,支持高效计算
c++层提供性能敏感功能
python层基于c++能力拓展更多功能,同时算子多态适配不同后端
图网络算子基于python层提供的运算实现