开发者社区> 问答> 正文

从内存角度Map的输出到Reduce的输入的过程是什么?

从内存角度Map的输出到Reduce的输入的过程是什么?

展开
收起
芯在这 2021-12-06 21:54:29 417 0
1 条回答
写回答
取消 提交回答
  • Map的输出到内存 Map将数据传入环形缓冲区(默认100MB 可修改),环形缓冲区中的数据到达一定的阈值时(默认0.8 可修改)进行溢写生成好多临 时文件,多个临时文件到达一定数量进行merge合并成一个大文件。

    Reduce数据读取 reduce会主动去发起拷贝线程到maptask获取属于自己的数据,数据会进入ReduceTask中的环形缓冲区,当缓冲区中的数据量到达 一定阈值进行溢写,多个临时文件merge合并成一个大文件,最后输入到Reduce。

    2021-12-06 21:54:46
    赞同 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
内存取证与IaaS云平台恶意行 为的安全监控 立即下载
云服务器ECS内存增强型实例re6全新发布 立即下载
用计算和数据去改变整个世界 立即下载