开发者社区> 问答> 正文

mapreduce 的大致流程

mapreduce 的大致流程

展开
收起
愚笨如你 2020-02-14 20:01:21 817 0
1 条回答
写回答
取消 提交回答
  • 主要分为八个步骤

    对文件进行切片,提前想好块的大小如何分配 启动相应数量的 maptask 进程 调用 FileInputFormat 中的 RecordReader,读一行数据并封装为 k1v1 调用自定义的 map 函数,并将 k1v1 传给 map,一个任务对应一个 map 收集 map 的输出,进行分区和排序,这块要注意优化。 reduce task 任务启动,并从 map 端拉取数据 reduce task 调用自定义的 reduce 函数进行处理 调用 outputformat 的 recordwriter 将结果数据输出

    2020-02-14 20:01:37
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云E-MapReduce 立即下载
基于HBase和Spark构建企业级数据处理平台 立即下载
实时即未来-Apache Flink年度最佳实践 立即下载