打扰了,咨询个问题,事实逻辑表定义了主键,在不同的分区数据还是有可能重复是吗?另外我看dws 汇总逻辑表在汇总计算某一个时间周期比如最近7天是以ds 分区字段来做sum的,这样会重复计算吗?因为ds 分区是填充的bizdate也就是t-1时间,df 表会每天生成一个全量分区
您好,可以在运维中看下事实表和汇总表的物化代码,就了解数据写入过程了,另外统计周期是在公共定义中配置的,最近7的计算逻辑是开始时间: lastNDate('${bizdate}', 7)结束时间: '${bizdate}';事实表如果配置的是日调度,则每天都会有新的分区生成,查询来源表的数据写入到是事实物化表中。,此回答整理自钉群“Dataphin公共云答疑群”
如果一个表定义了主键,那么在不同的分区中,主键的值仍然不能重复。因为主键是用来唯一标识一个记录的,如果重复了就会导致数据不一致。
至于您提到的 DWS 汇总逻辑表,通常在进行聚合计算时,需要根据某个时间字段进行分区。在这种情况下,确实会存在重复计算的问题。为了避免这种情况,可以采用增量聚合的方式,即只计算新增的数据,而不是每次都对全量数据进行计算。这样可以提高计算效率,并且避免重复计算的问题。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。