开发者社区> 问答> 正文

mapreduce 的大致流程

mapreduce 的大致流程

展开
收起
愚笨如你 2020-02-14 20:01:21 822 0
1 条回答
写回答
取消 提交回答
  • 主要分为八个步骤

    对文件进行切片,提前想好块的大小如何分配 启动相应数量的 maptask 进程 调用 FileInputFormat 中的 RecordReader,读一行数据并封装为 k1v1 调用自定义的 map 函数,并将 k1v1 传给 map,一个任务对应一个 map 收集 map 的输出,进行分区和排序,这块要注意优化。 reduce task 任务启动,并从 map 端拉取数据 reduce task 调用自定义的 reduce 函数进行处理 调用 outputformat 的 recordwriter 将结果数据输出

    2020-02-14 20:01:37
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
基于Kubernates的流处理平台实践 ——Flink为例 立即下载
阿里云E-MapReduce 立即下载
阿里云流计算Flink SQL核心功能解密 立即下载