DGL(0.8.x) 技术点分析-阿里云开发者社区

DGL(0.8.x) 技术点分析

2025-02-09 47

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时数仓Hologres，5000CU*H 100GB 3个月

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

实时计算 Flink 版，5000CU*H 3个月

简介： DGL是由Amazon发布的图神经网络开源库，支持TensorFlow、PyTorch和MXNet。DGL采用消息传递范式进行图计算，包括边上计算、消息函数、点上计算、聚合与更新函数等。其架构分为顶层业务抽象、Backend多后端适配、Platform高效计算适配以及C++性能敏感功能层，确保高效、灵活的图神经网络开发。

DGL为Amazon发布的图神经网络开源库(github)。支持tensorflow, pytorch, mxnet。

如何初始化一个图：

节点ID从0开始标号
G = dgl.graph((us, vs)) 一系列点和边，us->vs
G.add_nodes(n) 添加n个点
G.add_edge(u, v)添加边u->v
G.add_edges(u[s], v[s])添加边u[s]->v[s]
节点和边都可以具有特征数据，存储为键值对，键是可选的，值必须是张量

G.ndata['x'] = th.zeros((3, 5)) 对所有节点都设置特征数据，名称为x
G.ndata['y'] = th.randn(g.num_nodes(), 5) 不同名称的特征数据可以有不同形状
G.nodes[[0, 2]].data['x'] = th.ones((2, 5)) 对节点0,2设置特征数据

消息传递范式：

边上计算：计算边信息（涉及消息函数)

消息函数：接受edges，成员包括src, dst, data，得到发出的信息

点上计算：汇总边信息，更新点信息（涉及聚合函数，更新函数

聚合函数: 节点有属性mailbox访问节点收到的信息，并进行聚合操作(min, max, sum等)
更新函数: 用聚合函数的结果对原特征进行更新

高级API

update_all: 接受一个消息函数，一个聚合函数，一个更新函数

高效的消息传递代码

实现细节避免消耗大量内存: 大矩阵乘法分拆

在图的一部分上进行消息传递：用想囊括的节点创建一个子图

顶层提供对不同业务抽象

Backend层: 实现多后端适配

Platform层：适配不同架构，支持高效计算

c++层提供性能敏感功能

python层基于c++能力拓展更多功能，同时算子多态适配不同后端

图网络算子基于python层提供的运算实现

DGL(0.8.x) 技术点分析

大数据与机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景