CDH 搭建_ Hadoop _安装包|学习笔记

简介: 快速学习 CDH 搭建_ Hadoop _安装包

开发者学堂课程【2020版大数据实战项目之 DMP 广告系统(第二阶段)  CDH 搭建_ Hadoop _安装包】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/677/detail/11770


CDH 搭建_ Hadoop _安装包


内容介绍:

一、安装 Hadoop 的步骤

二、安装 Hadoop 软件包

 

已经安装了第一个 cdh 的程序即 Zookeeper 。本节课安装一个非常重要的程序,叫 Hadoop 。

 

一、安装 Hadoop 的步骤

在安装 Hadoop 时要分为多个步骤安装:第一步,安装 Hadoop 软件包;第二步,配置 HDFS ;第三步,配置 Yarn 。启动 HDFS 、Yarn ,整个 Hadoop 就安装完成。安装过程比较复杂但是步骤并不多。进入笔记中,找到 Hadoop 部分。

首先要关心的就是集群规划,即安装一个软件之前要想清楚在哪一个节点上装什么样的服务。首先, cdh 01的职责是比较重的因为大家都是一个 cpu 核心,两个 g 内存的情况,所以 node 01的负载还是比较高的,就需要针对 node 01进行一些简配。比如在 node 01上只装一个 ResourceManager 不装 NodeManager ;只装一个 NameNode 不装 DataNode 。这时 node 01相应的负载就会减轻,之后会在 node 01上启动 SecondaryNamenode 进行相应的辅助,还要启动 MapReduce HistoryServer 到时侯直接通过 cdh 01查看历史任务。之后还会在 cdh 01上运行 Hadoop 的指令,比如 HDFS 、 Yarn 就需要安装 Clients 。接下来在 cdh 02中,可以直接安装 NodeManager 和 DataNode 。 cdh 03中也是一样的。所以,从机只装一个装 NodeManager 和 DataNode ,也有计划到时候把 cdh 02和03的内存减少为1 g 。

 

二、安装 Hadoop 软件包

接下来看第一步,安装 Hadoop 软件包。刚才已经讲过集群规划,所以针对于主节点和从节点安装的软件包是不一样的;在主节点中 需要安装 yum -y install hadoop hadoop-yarn-resourcemanager hadoop-yarn-nodemanager hadoop-hdfs-secondarynamenode hadoop-hdfs-namenode hadoop-hdfs-datanode hadoop-mapreduce hadoop-mapreduce-historyserver hadoop-client 包,但是在从节点中,只需要安装个别的 yum -y install hadoop  hadoop-yarn-nodemanager hadoop-hdfs-datanode  hadoop-mapreduce  hadoop-client 包即可,上述内容就是本视频需要完成的内容。

首先,拷贝主节点上要安装的内容,进入窗口当中,进入 cdh 01中,直接将命令粘贴至此。可以看到安装了一个 hadoop 基本包、一个hadoop-yarn-resourcemanager 、一个 hadoop-yarn-nodemanager 。

image.png

这是不合理的,所以去掉 nodemanager ,装上不启动也是可以的。接着看 hadoop-hdfs-secondarynamenode hadoop-hdfs-namenode 都是需要的。因为 hadoop-hdfs-datanode 不需要,所以删除。如果已将安装是没影响的,只要不启动就可以。 hadoop-mapreduce hadoop-mapreduce-historyserver hadoop-client 都装在主节点中。按回车等待安装。

回到笔记当中查看 cdh 02和03当中需要安装的包。第一个 hadoop 基础包是必须装的,提供一些 Commonlib ,接下来hadoop-yarn-nodemanager hadoop-hdfs-datanode  hadoop-mapreduce  hadoop-client 都需要安装,复制上述指令,进入到 node 02( cdh 02)当中,粘贴至此;执行该指令。再次进入到 node 03( cdh 03)当中,粘贴至此,执行指令。虽然都是从本地下载,但是执行命令仍会消耗一些时间。

 

相关文章
|
分布式计算 资源调度 监控
Hadoop学习笔记(四)之YARN
Hadoop学习笔记(四)之YARN
|
SQL 分布式计算 并行计算
Hadoop学习笔记(三)之MapReduce
Hadoop学习笔记(三)之MapReduce
|
分布式计算 Hadoop 数据库
Hadoop学习笔记(HDP)-Part.08 部署Ambari集群
本文为HDP集群部署系列教程第八部分,详细介绍如何通过Ambari搭建HDP集群。涵盖Ambari数据库配置、ambari-server与ambari-agent的安装部署、自动化设置及Web界面登录等步骤,助力用户高效完成集群管理平台搭建。
512 0
|
SQL 分布式计算 Hadoop
centos7通过CDH部署Hadoop
centos7通过CDH部署Hadoop
|
分布式计算 资源调度 Hadoop
安装hadoop学习笔记
安装hadoop学习笔记
131 0
安装hadoop学习笔记
|
分布式计算 Hadoop 关系型数据库
Hadoop学习笔记(HDP)-Part.10 创建集群
本文为HDP集群部署系列第十篇,详细介绍通过Ambari创建集群的完整流程,包括版本选择、节点配置、服务安装及ZooKeeper核心参数解析,涵盖常用命令与典型问题处理,助力高效搭建稳定大数据环境。
490 0
|
分布式计算 Hadoop 网络安全
Hadoop学习笔记(HDP)-Part.04 基础环境配置
本文为HDP集群部署系列教程,涵盖从环境准备到组件安装的完整流程。包括SSH免密登录、Ansible自动化配置、主机名与hosts设置、基础软件安装、防火墙与SELinux关闭、NTP时钟同步及磁盘分区挂载等关键步骤,为后续Ambari与大数据组件部署打下坚实基础。
244 0
|
存储 机器学习/深度学习 分布式计算
Hadoop学习笔记(HDP)-Part.12 安装HDFS
本系列为HDP大数据平台部署实战指南,涵盖HDFS、YARN、Hive等核心组件安装配置,详解Ambari集群搭建、Kerberos安全认证及高可用实现,助力快速构建企业级大数据环境。
742 0
|
分布式计算 Java Hadoop
Hadoop学习笔记(HDP)-Part.11 安装Kerberos
本文详细介绍HDP集群中Kerberos的安装与配置,涵盖服务端客户端部署、关键配置文件修改、数据库创建、Ambari集成及常用管理命令,助力构建安全认证的大数据环境。
635 0
|
存储 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.09 安装OpenLDAP
本系列教程涵盖HDP大数据平台部署全流程,从环境准备、组件安装到高可用配置。第九部分重点介绍OpenLDAP的安装与配置,包括服务端/客户端部署、主从同步、Keepalived+HAProxy高可用架构搭建,以及通过phpldapadmin实现Web管理,为集群提供统一用户认证服务。
446 0

相关实验场景

更多