开发者社区> 问答> 正文

mapreduce的大致流程是什么?

mapreduce的大致流程是什么?

展开
收起
芯在这 2021-12-05 17:15:29 284 0
1 条回答
写回答
取消 提交回答
  • 主要分为八个步骤

    1/对文件进行切片规划

    2/启动相应数量的maptask进程

    3/调用FileInputFormat中的RecordReader,读一行数据并封装为k1v1

    4/调用自定义的map函数,并将k1v1传给map

    5/收集map的输出,进行分区和排序

    6/reduce task任务启动,并从map端拉取数据

    7/reduce task调用自定义的reduce函数进行处理

    8/调用outputformat的recordwriter将结果数据输出

    2021-12-05 17:15:41
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
基于Kubernates的流处理平台实践 ——Flink为例 立即下载
阿里云E-MapReduce 立即下载
阿里云流计算Flink SQL核心功能解密 立即下载