DataWorks产品使用合集之在进行测试数据集成时，目标库的数据是源库数据的3倍量，是什么导致的-阿里云开发者社区

DataWorks产品使用合集之在进行测试数据集成时，目标库的数据是源库数据的3倍量，是什么导致的

2024-06-10 172

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： DataWorks作为一站式的数据开发与治理平台，提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案，帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述，涵盖数据处理的各个环节。

问题一：DataWorks通过API创建补数据工作流，可以设置报警吗？

DataWorks通过API创建补数据工作流，可以设置报警吗？

参考回答：

您可以通过报警资源页面，查看当前账号指定地域下的报警资源，并设置每日报警短信和电话数量的上限。https://help.aliyun.com/zh/dataworks/user-guide/view-and-configure-alert-resources?spm=a2c4g.11186623.0.i35

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/574761

问题二：DataWorks自定义资源组可以迁移么？

DataWorks自定义资源组可以迁移么？

参考回答：

目前没有迁移功能。

自定义资源组https://help.aliyun.com/zh/dataworks/support/custom-resource-group-1?spm=a2c4g.11186623.0.i40

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/574756

问题三：DataWorks在测试数据集成时,任务完成后,请问是什么原因导致的呢？

DataWorks在测试数据集成时,任务完成后,目标库的数据是源库的数据 3倍量, 请问是什么原因导致的呢？不是分区表且写入前会清理怎么办？

参考回答：

1）追加写入，非覆盖写入

2）覆盖写入但是每天写入一个分区 3天就有3份数据，算了一下总数是一致的 2）核实一下源端查的是否是这个实例的库表jdbc:oracle:thin:@//202.193.199.73:1521/glhis"selectedDatabase":"GLHIS", "table":[ "GLHIS.MET_CAS_DIAGNOSE" ],

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/574752

问题四：DataWorks有一个中文字断，左右进行了去除空格处理，这种有什么办法找到两条的区别吗？

DataWorks有一个中文字断，左右进行了去除空格处理，看起来是一样的，但是分组后是两条，这种有什么办法找到两条的区别吗？

参考回答：

在DataWorks中对含有中文字断的数据进行去除空格处理后，尽管视觉上看起来这两条数据是一样的，但它们实际上已经被识别为两条不同的记录。为了找出这两条数据的区别，您可以采用以下方法：

使用数据对比工具：利用专门的数据对比工具可以方便地比较两条数据的差异。这些工具通常具备高级的比较和查找功能，能够根据字段内容进行精确匹配并高亮显示差异之处。
手动比较字段值：如果您处理的数据量相对较小，也可以采取手动方式来逐字段比较两条数据的取值。将这两条数据放置在一个表格或电子表格里，按行和列进行比对，以便准确找出不同点。
应用SQL查询进行比较：在数据库环境中，您可以通过编写具体的SQL查询语句来比对两条数据的字段值。通过编写适当的查询条件以及比较运算符，即可选取特定字段并进行值的比对，从而发现其中的不同。
导出文件后进行比较：另外，您还可以尝试将这两条数据分别导出为文件（例如CSV格式），然后利用文件对比工具来比对两个文件之间的差异。这种方式可以直观地展示字段值的变化情况。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/574751