备案控制台

开发者社区> 问答> 正文

hadoop2.2.0集群运行wordcount例子生成2个结果文件：报错

最近在虚拟机中安装了Hadoop2.2.0的集群，nameNode是redhat的，dataNode是ubuntu的，起服务进程都是正常的,通过JPS和50070都可以正常访问，运行例子wordcount后发现在输出文件夹里生成了2个结果文件,part-r-00000,part-r-00001，这2个文件里的内容完全不一样，就是把单词统计结果分别存到了2个文件中，结果是正确的，但是分在了2个文件中。请教大神，这会是什么问题导致的？SSH方面我配置了nameNode可以免登陆到dataNode，副本那个参数我配置了2，虽然只有1台dataNode

展开

收起

kun坤 2020-06-14 07:54:12 450 0

1 条回答

写回答

取消提交回答

kun坤

根据我的理解，你应该有2个reducer 这两个reducer 分别输出这两个文件。

可以参考 MultipleOutputs api文档进行重命名或者其他处理：

http://hadoop.apache.org/docs/r2.3.0/api/org/apache/hadoop/mapreduce/lib/output/MultipleOutputs.html

另见解释

http://stackoverflow.com/questions/10924852/map-reduce-output-files-part-r-and-part
######怎么看是不是有2个reduce？我看了参考的网址，上面说的是用代码，可是我现在是运行例子程序，而且是直接用shell脚本运行jar######
我找到原因了，是因为mapred-site.xml中我配的了mapred.map.tasks和mapred.reduce.tasks。

<property>

<name>mapred.map.tasks</name>

<value>10</value>

<description>As a rule of thumb, use 10x the number of slaves(i.e., number of tasktrackers).

</description>

</property>

<property>

<name>mapred.reduce.tasks</name>

<value>2</value>

<description>As a rule of thumb, use 2x the number of slaveprocessors (i.e., number of tasktrackers).

</description>

</property>
我查了这个属性的设置是需要根据硬件环境相关的并发数，可能我设置的数量不正确导致，我把这2项属性设置去除后就正常了
######setReduceTaskNum?######我不是用代码去跑的，所以我也不清楚是不是你说的这个，我只是直接命令行运行jar包

2020-06-14 07:54:20

赞同展开评论打赏

问答分类：

Ubuntu Linux 网络安全云虚拟主机

问答标签：

hadoop集群 hadoop集群运行 hadoop运行 hadoop wordcount hadoop集群wordcount

问答地址：

开发者社区 > 开发与运维 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

在Flink CDC中，Hadoop 运行在虚拟机环境报错可能是什么原因呢？

28

0

0

Flink CDC中hudi connector必须在hadoop环境下运行吗？

94

1

0

在机器学习PAI中alink可以在hadoop3的yarn集群环境中运行吗？

343

2

0

alink可以在hadoop3的yarn集群环境中运行吗？我看pom文件里面配置的都是2.8.0

154

1

0

Hadoop中关系型数据库的表很难在集群中展开放到不同的机器上为什么呢？

845

1

0

为什么下载了Hadoop之后直接能够在Linux系统上运行hdfs文件呀？

1071

1

0

新版数据湖对比 Hadoop 集群优势是什么？

601

1

0

flink cdc 一定要打成jar包提交到集群运行吗？能不能像连Hadoop集群一样，通过连接UR

1067

1

0

flink的高可用必须搭建Hadoop 集群吗？

792

1

0

各位，问一个问题，在生产环境使用Flink CDC必需要搭建一个hadoop集群来管理检查点吗？

832

1

0

问答排行榜

最热

最新

1 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1819242

2 据说在家办公的程序员是这样写代码的？ 1793438

3 阿里云开放端口权限 690438

4 如何升级配置 536388

5 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 523046

6 【精品问答】python技术1000问(1) 514185

7 Flink Forward Asia 2021 有奖问答 512958

8 OceanBase 使用动画（持续更新） 359413

9 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329835

10 OSS存储服务-客户端工具 321692

11 为体验实验室取一个新名字。 307537

12 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 304192

13 Win Server 2003-2016 加密勒索事件必打补丁合集 295382

14 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 284343

15 安全组详解，新手必看教程 277394

16 写code还是做管理，开发者如何进行职业规划？ 269375

17 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255907

18 支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】 236376

19 阿里云手机和阿云浏览器连接问题专帖 235722

20 请问阿里云邮箱如何开启SMTP服务啊！ 225950

1 春节假期返工后，你有哪些提升职场幸福感的小技巧？ 266

2 什么样的代码让人一眼就能看出是AI写的？ 229

3 DeepSeek API 调用没反应，超时后报错 500，这是啥意思，按照对接文档调用的啊 1150

4 钉钉机器人发送群消息消息，突然不能@人了，昨天还正常，代码没有任何调整，是有什么配置或者服务到期了吗 246

5 本地部署开源模型Qwen2.5-coder-32b，和直接使用线上api同样参数的模型，差距很大 110

6 大模型数据处理vs人工数据处理，哪个更靠谱？ 1986

7 AI年味，创意新年，你认为AI能否为春节活动增添新意呢？ 1723

8 通义灵码是否支持eclipse 108

9 点击VS Code通义灵码插件，无法加载出对话窗口，并报错 255

10 在使用vscode和idea 中的通义灵码时，均无法应用AI程序员的修改 163

11 AI程序员功能有一个严重的问题，严重到基本可以认为AI程序员无法发挥任何作用。 330

12 在VS code中使用AI程序员修改建议无法直接应用，点击接受后提示操作失败。 160

13 赶紧把通义灵码idea插件自动生成流程图功能给关了吧。太难用了。 178

14 在海量用户中，将如何快速定位到目标人群进行个性化营销？ 1219

15 你认为哪些领域的知识对开发者来说特别重要？ 926

16 使用安全体检功能，看看你有多少未修复的安全问题？ 3760

17 通义灵码的AI程序员问题 241

18 强烈建议宜搭手机端改版，现在都展示些什么乱七八糟的内容。 386

19 AI时代，聊聊如何从海量数据中挖掘金矿？ 1532

20 宜搭时间轴组件有问题 123

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

140

19

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

156

32

去学习

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

351

9

去学习

大数据Hadoop快速入门

3882

18

去学习

Hadoop快速入门

3846

39

去学习

Hadoop企业优化及扩展案例

435

7

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》 立即下载

零基础实现hadoop 迁移 MaxCompute 之数据 立即下载

CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载

相关实验场景

更多