开发者社区> 问答> 正文

Structured Query Language表分区优化都有什么呢?

Structured Query Language表分区优化都有什么呢?

展开
收起
bnbajjyhyjfty 2021-12-11 22:13:16 516 0
1 条回答
写回答
取消 提交回答
  • 表分区优化

    建立分区表 ·CreateTable t1(.)partitioned by(pt string,region string)·分区层数不要太多

    分区裁剪 ·避免全表扫描,减少资源浪费 ·Case:wherept=xxxandregion=xxx·分区尽量按层级顺序裁剪 分区值尽量常量化,避免不可确定值如UDF·分区值尽量避免引用列的表达式计算或者子查询 写分区

    写入静态分区,优化数据存储

    动态分区,防止小文件过多和计算长尾

    2021-12-11 22:14:45
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Spark SQL:Another 16x faster 立即下载
LLAP: Sub-Second Analytical Queries in Hive 立即下载
A Deep Dive into Flink SQL 立即下载