开发者社区> 问答> 正文

Spark为什么比mapreduce快?

Spark为什么比mapreduce快?

展开
收起
茶什i 2019-10-25 16:08:58 2930 0
3 条回答
写回答
取消 提交回答
  • 下一站是幸福

    spark是基于内存进行数据处理的,MapReduce是基于磁盘进行数据处理的 MapReduce的设设计:中间结果保存在文件中,提高了可靠性,减少了内存占用。但是牺牲了性能。

    2020-08-21 12:24:07
    赞同 展开评论 打赏
  • 除了设计理念和架构层面(内存计算和DAG),spark在后续的优化过程中不断进行优化,比如专门启动了一个钨丝计划(tungsten),钨丝计划主要涉及三块:(1)Memory Management and Binary Processing,(2)Cache-aware computation,(3)Code generation,可以查看blog:https://databricks.com/glossary/tungsten

    2020-03-06 20:32:52
    赞同 展开评论 打赏
  • 1)基于内存计算,减少低效的磁盘交互;
    2)高效的调度算法,基于DAG;
    3)容错机制Linage,精华部分就是DAG和Lingae

    2019-10-25 16:15:02
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载