开发者社区> 问答> 正文

打扰了,咨询个问题,事实逻辑表定义了主键,在不同的分区数据还是有可能重复是吗?另外我看dws 汇总逻

打扰了,咨询个问题,事实逻辑表定义了主键,在不同的分区数据还是有可能重复是吗?另外我看dws 汇总逻辑表在汇总计算某一个时间周期比如最近7天是以ds 分区字段来做sum的,这样会重复计算吗?因为ds 分区是填充的bizdate也就是t-1时间,df 表会每天生成一个全量分区

展开
收起
真的很搞笑 2023-04-18 12:57:06 133 0
2 条回答
写回答
取消 提交回答
  • 您好,可以在运维中看下事实表和汇总表的物化代码,就了解数据写入过程了,另外统计周期是在公共定义中配置的,最近7的计算逻辑是开始时间: lastNDate('${bizdate}', 7)结束时间: '${bizdate}';事实表如果配置的是日调度,则每天都会有新的分区生成,查询来源表的数据写入到是事实物化表中。,此回答整理自钉群“Dataphin公共云答疑群”

    2023-04-18 22:56:51
    赞同 展开评论 打赏
  • 值得去的地方都没有捷径

    如果一个表定义了主键,那么在不同的分区中,主键的值仍然不能重复。因为主键是用来唯一标识一个记录的,如果重复了就会导致数据不一致。

    至于您提到的 DWS 汇总逻辑表,通常在进行聚合计算时,需要根据某个时间字段进行分区。在这种情况下,确实会存在重复计算的问题。为了避免这种情况,可以采用增量聚合的方式,即只计算新增的数据,而不是每次都对全量数据进行计算。这样可以提高计算效率,并且避免重复计算的问题。

    2023-04-18 16:06:33
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
聚焦数据管理交流、问答互动小花园。
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载