开发者社区> 问答> 正文

如果改为并行HASH JOIN,并行化改造的方案有哪几种解决方案?

如果改为并行HASH JOIN,并行化改造的方案有哪几种解决方案?

展开
收起
游客gbsb4ehzllekm 2022-05-11 13:37:02 257 0
来自:阿里技术
1 条回答
写回答
取消 提交回答
  • 方案一是将2个表都按HASH key进行分区,相同HASH值的数据处于同一个分区内,由同一个线程执行HASH JOIN。

    方案二是创建一个共享的Build表,由所有执行HASH JOIN的线程共享,然后每个线程并行读取属于自己线程的另外一个表的分片,再执行HASH JOIN。

    最终选择哪种方案,通过代价估算来决定。

    2022-05-11 22:32:35
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
Phoenix 全局索引原理与实践 立即下载
HareQL:快速HBase查询工具的发展过程 立即下载
Quanta:Quora的HBase分层计数系统 立即下载