开发者社区> 问答> 正文

避免数据倾斜的分布策略选择规则有哪些?

已解决

避免数据倾斜的分布策略选择规则有哪些?

展开
收起
云上静思 2022-11-03 12:26:23 332 0
来自:阿里云认证
1 条回答
写回答
取消 提交回答
  • 推荐回答

    • 分布策略选择规则:

    ü 小表(总行数低于1 万)优先选择复制表分布策略(DISTRIBUTED REPLACATED)。

    ü 大表优先选择参与Join/GroupBy 计算的字段作为分布键Hash 分布。

    ü 若没有数据分布均匀的字段作为分布键使用,采用随机分布策略(DISTRIBUTED RANDOMLY)。

    以上内容摘自《阿里云认证的解析与实战-数据仓库ACP认证》电子书,点击https://developer.aliyun.com/ebook/download/7807 可下载完整版

    2022-11-03 14:16:23
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
阿里云认证的泛云生态人才交流绿洲,持续带来丰富多样的认证活动、行业资讯,以及实时的线上学习交流机会,希望大家都能加入一起玩!诚邀您加入阿里云认证官方学习福利群:33715706。
问答排行榜
最热
最新

相关电子书

更多
《用管控策略设定多账号组织全局访问边界》 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载