开发者社区> 问答> 正文

如果改为并行HASH JOIN,并行化改造的方案有哪几种解决方案?

如果改为并行HASH JOIN,并行化改造的方案有哪几种解决方案?

展开
收起
游客gbsb4ehzllekm 2022-05-10 18:35:03 243 0
来自:阿里技术
1 条回答
写回答
取消 提交回答
  • 方案一是将2个表都按HASH key进行分区,相同HASH值的数据处于同一个分区内,由同一个线程执行HASH JOIN。方案二是创建一个共享的Build表,由所有执行HASH JOIN的线程共享,然后每个线程并行读取属于自己线程的另外一个表的分片,再执行HASH JOIN。最终选择哪种方案,通过代价估算来决定。

    2022-05-10 21:06:37
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
Phoenix 全局索引原理与实践 立即下载
事务、全局索引、透明分布式 立即下载
李劲松|Flink Table Store 典型应用场景 立即下载