dataworks在完成调度配置后,提交节点的数据血缘关系如何处理?
在DataWorks中,数据血缘关系是一个核心功能,它可以展示当前节点与其他节点之间的关系,包括依赖关系图和内部血缘图两部分。这种关系的确定需要先理解节点的表血缘关系,例如表数据间的血缘关系、表产出的分区数据等。
当各个节点完成调度配置并提交节点时,DataWorks会检查节点的调度依赖与节点代码中的数据血缘关系是否一致。如果存在不一致的情况,系统会给出提示。这时,您需要根据实际情况查看是否需要修改调度依赖配置。
此外,DataWorks的数据血缘功能还支持可视化展示敏感数据的血缘关系,自动分析字段之间的异常关联关系、敏感数据识别结果异常的字段,帮助您梳理敏感数据的扩散情况及影响面,提高数据识别效率。
各个节点在完成调度配置后,提交节点时,DataWorks会检查节点的调度依赖与节点代码中的数据血缘关系是否一致,如果出现不一致的提示,您需要根据实际情况查看是否需要修改调度依赖配置。详情可参见提交节点时提示:输入输出和代码血缘分析不匹配。
https://help.aliyun.com/document_detail/137550.html
,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
在DataWorks中,完成调度配置后,提交节点的数据血缘关系处理主要涉及以下两个方面:
在DataWorks中,完成调度配置后,提交节点的数据血缘关系会按照以下方式处理:
自动解析血缘关系:DataWorks会自动解析和更新提交节点的数据血缘关系。当您提交一个节点后(例如一个数据同步任务或数据处理任务),DataWorks会根据节点的输入表、输出表以及中间表等信息,自动识别和更新相关的数据血缘关系。
血缘关系图展示:DataWorks会在血缘关系图中显示提交节点与其他节点之间的血缘关系。您可以通过查看血缘关系图来了解数据在整个流程中的传递路径和依赖关系。
血缘关系记录:除了图形化展示,DataWorks还会记录和保存提交节点的血缘关系信息。这些信息可以在数据开发界面中的“血缘记录”中查看,以便更详细地分析和追溯数据的来源和去向。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。