备案控制台

开发者社区问答正文

mapreduce 的大致流程

mapreduce 的大致流程

展开

收起

愚笨如你 2020-02-14 20:01:21 858 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

愚笨如你

主要分为八个步骤

对文件进行切片，提前想好块的大小如何分配启动相应数量的 maptask 进程调用 FileInputFormat 中的 RecordReader，读一行数据并封装为 k1v1 调用自定义的 map 函数，并将 k1v1 传给 map，一个任务对应一个 map 收集 map 的输出，进行分区和排序，这块要注意优化。 reduce task 任务启动，并从 map 端拉取数据 reduce task 调用自定义的 reduce 函数进行处理调用 outputformat 的 recordwriter 将结果数据输出

2020-02-14 20:01:37

赞同展开评论

问答分类：

分布式计算

问答标签：

mapreduce流程开源大数据平台 E-MapReduce流程开源大数据平台 E-MapReduce大致流程

问答地址：

开发者社区 > 大数据 > 问答

相关问答

E-MapReduce弹性伸缩配置本地盘机型扩容流程报错问题

85

0

0

E-MapReduce EMR集群JindoSDK升级流程

93

1

0

E-MapReduce EMR集群JindoData升级流程

90

1

0

E-MapReduce ECS自身问题导致弹性伸缩流程卡住

109

1

0

MapReduce的工作流程是怎样的呢？

622

1

0

mapReduce中shuffle阶段的工作流程是什么，如何优化shuffle阶段呢？

395

1

0

mapreduce的大致流程是什么？

320

1

0

E-MapReduce Hadoop类型集群的ranger-plugin中没有enablehi...

135

1

0

为什么我的包年包月E-MapReduce集群中按量ECS节点/抢占式ECS实例也会产生EMR服务费

111

1

0

E-MapReduce存量集群如何添加Kerberos认证

94

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

别再全量拉表了兄弟：一篇讲透增量数据处理与 CDC 的实战指南

MaxCompute SQL AI 实战案例征集令

【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

传统企业从零搭建数据平台 - 日记20251215

还有其他疑问?