开发者社区> 问答> 正文

MapReduce与spark的磁盘I/O有什么不同?

MapReduce与spark的磁盘I/O有什么不同?

展开
收起
游客fq2cv4o24bhvc 2021-12-07 18:59:22 335 0
1 条回答
写回答
取消 提交回答
  • MapReduce 的 map 端将中间输出和结果存储在磁盘中,reduce 端又需要从磁盘读写中间结果,势必造成磁盘IO成为瓶颈。

    Spark允许将map端的中间输出和结果存储在内存中,reduce端在拉取中间结果时避免了大量的磁盘 I/O。

    2021-12-07 19:00:12
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载