hadoop安装使用的命令+linux基本操作命令+HDFS常用命令

简介: 一、Hadoop基本安装主要包括以下6个步骤:1.创建Hadoop用户。2.更新apt和安装Vim编辑器。3.安装SSH和配置SSH无密码登录。4.安装Java环境。5.安装单机Hadoop。6.HDFS:启动

一、Hadoop基本安装主要包括以下6个步骤:

1.创建Hadoop用户。
2.更新apt和安装Vim编辑器。
3.安装SSH和配置SSH无密码登录。
4.安装Java环境。
5.安装单机Hadoop。
6.HDFS:启动

1.创建Hadoop用户:

a.创建用户命令如下:
sudo useradd -m hadoop -s /bin/bash
b.接着使用命令设置密码(一半设为hadoop)
sudo passwd hadoop(注意要输入两次)
c.为hadoop用户增加管理员权限(避免一些比较棘手的权限问题)
sudo adduserr hadoop sudo

2.更新apt和安装Vim编辑器

a.更新apt
sudo apt-get update
b.安装Vim编辑器
sudo aot-get install vim

3.安装SSH和配置SSH无密码登录

a.sudo apt-get install openssh-server
b.ssh localhost
出现提示后输入yes并输入密码就可以了,但是每次登录都要输入密码,搜易我们设置无密码登录
c.exit
d.cd ~/.ssh/
e.ssh-keygen -t rsa(一直回车)
f.cat ./id_rsa.pub >> ./authorized_keys(完成)

4.安装Java环境(这一部分考的概率不是很大)

a.配置完环境变量时,让其生效命令 source ~/.bashrc
b.查看是否安装成功  java -version
c.如果能显示具体的版本号,就说明安装成功了。  java version "1.8.0_162"... ...

5.安装单机Hadoop

a.先解压
b.修改目录权限  sudo chown -R hadoop ./hadoop
c.查看版本信息  ./bin/hadoop version (注意:要在hadoop目录主下)
d.如果显示Hadoop的具体版本就成功了  Hadoop 3.1.3  ... ...

5.1.创建input目录,用来存放目录

cd /usr/local/hadoop
mkdir input

5.2.将 /usr/local/hadoop/etc/hadoop 目录下的配置文件复制到input目录下,命令如下:

cp ./etc/hadoop/*.xml ./input

5.3.运行hadoop自带的Grep实例

5.4.查看输出数据:

cat ./output/*

5.5.可以得到以下结果:

dfsadmin
dfs.replication
dfs.namenode.name.dir
dfs.datanode.data.dir

6.HDFS的启动命令:

cd /usr/local/hadoop
./sbin/start-dfs.sh
启动过程中所有的启动信息都写进了对应的日志文件,如果出现错误,可以在日志文件中查看

6.1查看是否启动成功:

输入:jps
输出:jps
NameNode
SecondaryNameNode
DataNode

6.2查看Hadoop的信息:

http://localhost:9870

6.3在HDFS创建的hadoop用户的用户目录

cd /usr/local/hadoop
./bin/hdfs dfs -mkdir -p /user/hadoop

6.4在HDFS的“/user/hadoop”目录下创建input目录

./bin/hdfs dfs -mkdir input

6.5实现文件上传:

./bin/hdfs dfs -put ./etc/hadoop/*.xml input

6.6运行测试样例程序Grep

6.7系统会自动创建output目录,结果会存储在这里面

6.8查看结果:

./bin/hdfs dfs -cat output/*
会得到相同的结果。

6.9注意:

当重新运行程序时,首先将output目录删除
删除命令:./bin/hdfs dfs -rm -r output

6.10当需要停止HDFS时命令:

cd /usr/local/hadoop
./sbin/stop-dfs.sh

二、Linux基本命令

1.cd 命令:切换目录

a.切换到指定目录:cd /usr/local/hadoop
b.切换到当前目录的上一级 cd ..
c.切换到当前登录Linux操作系统的用户的自己的主文件夹  cd /home/你的名字

2.ls 命令:查看文件与目录

查看目录“/usr”下的所有文件和目录 ls -l/-a

3.mkdir 命令:新建目录

a.进入/tmp目录,创建一个名为‘a’的目录,并查看此目录下已经存放了那些目录
cd /tmp
mkdir a
ls -l
b.进入/tmp目录,创建“a1/a2/a3/a4”
mkdir -p a1/a2/a3/a4

4.rmdir 命令:删除空的目录

5.cp 命令:复制文件或目录:


目录
相关文章
|
7月前
|
Java Linux 应用服务中间件
【JavaEE进阶】 Linux常用命令
【JavaEE进阶】 Linux常用命令
|
8月前
|
人工智能 Linux 开发工具
linux 对文件内容的查看、归档 及 vim基本操作
linux 对文件内容的查看、归档 及 vim基本操作
|
5月前
|
安全 Linux Shell
HDFS常用命令
HDFS常用命令
56 1
|
2月前
|
分布式计算 Java Hadoop
linux中HADOOP_HOME和JAVA_HOME删除后依然指向旧目录
通过以上步骤,可以有效地解决 `HADOOP_HOME`和 `JAVA_HOME`删除后依然指向旧目录的问题。确保在所有相关的配置文件中正确设置和删除环境变量,并刷新当前会话,使更改生效。通过这些措施,能够确保系统环境变量的正确性和一致性。
36 1
|
7月前
|
Linux 开发者
Linux基础:常用命令及其用途
这些命令只是Linux命令行的冰山一角,但它们构成了日常工作的基础。通过掌握这些基本命令,你可以更有效地利用Linux系统的强大功能。随着你对这些基础命令的熟练应用,你会发现自己能够更快地完成任务并解决问题。
60 2
|
3月前
|
分布式计算 监控 Hadoop
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
Hadoop-29 ZooKeeper集群 Watcher机制 工作原理 与 ZK基本命令 测试集群效果 3台公网云服务器
61 1
|
4月前
|
资源调度 分布式计算 Hadoop
使用YARN命令管理Hadoop作业
本文介绍了如何使用YARN命令来管理Hadoop作业,包括查看作业列表、检查作业状态、杀死作业、获取作业日志以及检查节点和队列状态等操作。
96 1
使用YARN命令管理Hadoop作业
|
5月前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
|
6月前
|
分布式计算 Hadoop
hadoop格式化HDFS的命令
【7月更文挑战第21天】
646 5
|
6月前
|
分布式计算 资源调度 Hadoop
Hadoop执行格式化命令
【7月更文挑战第20天】
151 1