开发者社区 问答 正文

大表join小表产生的问题,怎么解决?

大表join小表产生的问题,怎么解决?

展开
收起
游客ysk6odvtzspxs 2021-12-05 11:23:07 473 分享 版权
1 条回答
写回答
取消 提交回答
  • 就是在Map阶段进行表之间的连接。而不需要进入到Reduce阶段才进行连接。这样就节省了在Shuffle阶段(会跟磁盘打交道)时要进行的大量数据传输。从而起到了优化作业的作用。

    2021-12-05 11:25:49
    赞同 展开评论
问答地址: