Ambari安装之部署3个节点的HA分布式集群

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介:

 其实,按照这个步骤是一样的。只是按照好3个节点后,再做下HA即可。

 

 

部署3个节点的HA分布式集群

(1)添加机器

和添加服务的操作类似,如下图

之后的添加ambari03、ambari04操作就和部署ambari02类似,可以参照前面的步骤。这里不多赘述。

Ambari安装之部署单节点集群

 

 

 

 

复制代码
复制代码
-----BEGIN RSA PRIVATE KEY-----
MIIEogIBAAKCAQEAvLAEPDRhnQUq4+6IRYTF6YKmMfvfGKKbkgEX5RrZ89BQbiOm
jqWrcb8yAi6zFY/uHCM6cBG/BzdmHPlTYZwAmt8qI4hs/5NvkjLUmlwFe2+fYofZ
6kRfuJh4eEyysiLhZBEkgb4UYtDQgvB12eFBgieHSkl2+nUVorgvbnIbcqoAz/fN
4d9iU5oa5pShjQkAL1NKUmLZAh1PcFSq1OGGGEtsWFp7ggt8ufahejyZeqstbWl0
vAxohuvYdW5YjIHJhLP7ld7arsv9f40RMNEdPuWOTWegM6p94oFRAIln9Wtcc271
jQoF3xjhqUpV17PU3ErZ6+wsVukZ3iMtP/PqPQIBIwKCAQB2moZRuoZ/9J6d5mRI
9F8lEEs1XH2adNbQzXy75P4G9/gKt1LAEF0i7TVgdSAcLpWrSVfurBGsw7yHPaIg GOpv+f066An/u8J5J0POvX/J7mQvThPyVt0U8h/Wlpw1dQKz7YSpUug+HNrV9jtz Ap40jeACzxeWHbXT/r66c5w5cRciB4eFQ14xO3FZyfCcD5AjAWYNyze7mI5i8396 VscwVCd2qUsMQnjR6RXQd/vK3KJ62S0rxKQ0UC5+H5OxVny9m9q+8Qy53iEMtX/n GzDph2OGTGHBrR/+kOjdwx9kXy5FknL5Q1EITeERI0NcFmwN1UlEyaAGkDNf88ye hzjDAoGBAO7yyfNTcQpy0ZdAhVDWDb+ohKt83ucrkiW87dXHPPo/QEJOZCl2SsVt bB4p4gEUcpxy5rgkgB0JAuvnAv4JZ49I+NOASOnVpuhty0qGzRmvk1soGQn6TyfK HwybRLXTHUiQfx0UQFTrbNdpubx0CKT0fBKBBviejyfSOE59pM//AoGBAMonCpo6 a+TvjNr0TgwbyzhPHdmRBnZDXkctQIo/YE704l+eoywbKGty9MlWJ1lGZTFlnZej Xxe2Uhb0UGPo+VyCccBxc4slz1TaoQbRnpLV+s7+Mik/atG9kwB41Bd2/HjRWFAa x1LyGN5ee2hocD4u5C/x0vrzulp+5wH0poXDAoGBAIG2/+p9wQWsC2C8oCSRdS2H XfaxgFGbT1ZQnl4bs2NG6F6CU6F6uuA0Fh8AyyUoW3mANBrR/GeIjI6wmzly0dFw wZdi5cDEcIzN42L4uHuodJCSHDid0zLbb/DmkwOefZxrsrgDreT01K9z6Hw+/WDc fd4oyUUi3/+sojk85HDpAoGBALjTPOTHsxp0ngoD75YKyG3/MTvyTw0KZNNckseK Zq6WwFdsd+3Pr+015x56p6IUecbDTkF/bOJ6zrXmr+ZRWQQfffHG0AoxMpa5QsRn 4XBOnCr3CUpInC16IABueMT/Erea1GZ+4h/zSe/hWuMdqHNeEnT6Wn8KuQJII6oE QHpLAoGAYNNuiUgLrqRq8Klb4Fj0pbwWzrvNkON+j01mIEzPeNNto01GbLXKQwhe mbWMSnLHarmFWJ7Yamagzx1I/ifRjUUFLchcxLH0VDv0e1ZYaD1FV2IQNJNS4gWE m8Xbq7v4bjOmZvAfVoorH+gnvh0SMNTyFGq+rSB9wCsII3nLGPo= -----END RSA PRIVATE KEY-----
复制代码
复制代码

 

 

 

 

 

 

 

 

 

 

 

 

 

(2)添加服务

添加ambari03、ambari04的服务的操作和前面的ambari02类似,具体可以参照前面的步骤。这里不多赘述。

Ambari安装之部署单节点集群

 

 

 

 

  当然,我下面这里就是,ambigdata1、ambigdata2、ambigdata3和ambigdata4,组成的4节点的HA大数据集群。

  我这里,就吧所有的服务都加进去。

 

 

 

 

 

 

 

 

 

 

(3)配置HA

 选择,HDFS   ->  services  ->    service actions    ->  enable namenode HA

        YARN  ->   services  ->    service actions    ->enable resourcemanager HA

  以后再贴图。

接下来按照命令提示一步一步操作即可

 

  这里,大家,如何控制下呢?

 

 

 

 

 

 

 

 

  比如,这里,我参考这篇博客

完全分布式Hadoop集群的安装搭建和配置(4节点)

  在这里,为了今年实验室环境所需。所以,将计算节点动态设置为4。来迎合论文里的4、3、2和1节点,对比加速比。

 

 

 

 

 

  则最后得到,是如下

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  然后,下面就是,等同于apache版本的hive安装的配置文件hive-site.xml

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  然后呢,相信大部分博友,跟我一样,在这里,对下面三个现在,都不知道怎么设置。没关系,大家,可以先跳过。

 

 

 

 

 

 

 

 

 

 

 

 

 

  以后,再回来设置即可。这个不难。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

保证所有服务都正常启动之后,下面我们就可以上传文件到HDFS,并运行Mapreduce了

 

 

 

 

 

 

  那就改成mysql数据库来吧

 

 

 

 

 

 

   这里啊,我查了下资料

数据库要求
          Hive/HCatalog、Oozie和Ambari都需要一个内部数据库。
          Hive/HCatalog:默认使用Ambari自带的Mysql5.x。也可以自己配置Oracle 11g r2。
          Oozie:默认使用Ambari自带的Derby。也可以自己配置Mysql5.x和Oracle 11g r2。
          Ambari:默认使用Ambari自带的PostgreSQL8.x,也可以使用Oracle 11g r2.
 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

  然后

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

http://192.168.86.21:8080/#installer/step8

 

 

 

   比如这不,有个什么Hcat client安装失败。多刷新,反复这里就是。(因为是网速原因)

 

   最后,一定会成功,全部安装完全的!

 

 

 

 

 

 

 

 

 

 

  如下是我开启全部服务的过程:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 对于这样的日志报错
一般是怎么看的,请问 
 jdbc驱动没有。传个上去 
 
 

 

 

 

 

 

 

 

 

 手动安装apahce版本的oozie和cdh的oozie,我会下面的这篇博客就是已经解决了

Oozie安装时放置Mysql驱动包的总结(网上最全)

 

 

现在,这里是ambari里安装oozie,一直不知道怎么放mysql-con**驱动jar包,

 以后你有时间解决下!!!
 
 

   其实,很简单

[root@ambigdata1 ~]# yum install mysql-connector-java
Is this ok [y/N]: y

  即可

 

 

心得:一般在公司里,是,开启了服务,就不需再关闭。
       只有自己的电脑,比如搭建了4个虚拟机这样的来,关闭再开启。
       好啦,写这篇博客是为了帮助入门的博友们,同时,也是,为了最近要在自己实验室,搭建真实物理机器的多节点大数据集群!
  
 
 
 
 
 

 

 

 

(4)运行MapReduce程序

1)上传文件到HDFS

执行命令:cd /usr/hdp/current/hadoop-client/bin这个目录下创建vi wc.txt这个文件,然后输入相应的内容

执行命令:sudo -u hdfs hadoop fs -put wc.txt /hdpCluster

 

文件上传成功之后就可以执行命令运行mapreduce程序了,运行如下命令

yarn jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-mapeduce-examples-2.7.1.2.4.0-169.jar   wordcount   /hdpCluster/wc.txt   /output

 

 

可能会报权限的问题,那么我们只需要修改一下对应的权限即可,例如使用下面的方法。

sudo  -u  hdfs  hadoop fs -ls /

sudo -u  hdfs  hadoop  fs  -chown -R  hadoop:hadoop   /

sudo  -u  hdfs  hadoop  fs  -ls  /

 

 

Mapreduce执行成功之后通过如下命令查看程序运行结果

sudo  -u  hdfs  hadoop  fs -cat  /output/part*

那么到此为止我们的ambari安装部署HA分布式集群就给大家演示完毕了!



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6629251.html,如需转载请自行联系原作者

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
6月前
|
存储 负载均衡 NoSQL
【赵渝强老师】Redis Cluster分布式集群
Redis Cluster是Redis的分布式存储解决方案,通过哈希槽(slot)实现数据分片,支持水平扩展,具备高可用性和负载均衡能力,适用于大规模数据场景。
468 2
|
11月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,展现卓越性能与性价比。其轻量版满足国产化需求,兼具高性能与低成本,适用于多种场景,推动数据库技术革新与发展。
|
5月前
|
算法 调度
【孤岛划分】分布式能源接入弹性配电网模型研究【IEEE33节点】(Matlab代码实现)
【孤岛划分】分布式能源接入弹性配电网模型研究【IEEE33节点】(Matlab代码实现)
569 10
|
10月前
|
安全 网络安全 数据库
YashanDB分布式节点间SSL连接配置
本文介绍YashanDB分布式节点间SSL连接配置方法,确保通信安全。需统一为整个集群配置SSL,使用相同根证书签名的服务器证书,否则可能导致连接失败或数据库无法启动。文章详细说明了使用OpenSSL生成根证书、服务器私钥、证书及DH文件的步骤,并指导如何将证书分发至各节点。最后,通过配置数据库参数(如`din_ssl_enable`)并重启集群完成设置。注意,证书过期需重新生成以保障安全性。
|
5月前
|
并行计算 算法 安全
【ADMM、碳排放】基于分布式ADMM算法的考虑碳排放交易的电力系统优化调度研究【IEEE6节点、IEEE30节点、IEEE118节点】(Matlab代码实现)
【ADMM、碳排放】基于分布式ADMM算法的考虑碳排放交易的电力系统优化调度研究【IEEE6节点、IEEE30节点、IEEE118节点】(Matlab代码实现)
300 0
|
5月前
|
算法 安全 新能源
基于DistFlow的含分布式电源配电网优化模型【IEEE39节点】(Python代码实现)
基于DistFlow的含分布式电源配电网优化模型【IEEE39节点】(Python代码实现)
438 0
|
9月前
|
监控 Linux 应用服务中间件
Linux多节点多硬盘部署MinIO:分布式MinIO集群部署指南搭建高可用架构实践
通过以上步骤,已成功基于已有的 MinIO 服务,扩展为一个 MinIO 集群。该集群具有高可用性和容错性,适合生产环境使用。如果有任何问题,请检查日志或参考MinIO 官方文档。作者联系方式vx:2743642415。
3185 57
|
6月前
|
存储 并行计算 算法
【前推回代法】含有分布式电源的三相不平衡配电网潮流计算【IEEE33节点】(Matlab代码实现)
【前推回代法】含有分布式电源的三相不平衡配电网潮流计算【IEEE33节点】(Matlab代码实现)
236 0
|
10月前
|
Cloud Native 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
云原生数据库PolarDB技术揭秘:Limitless集群和分布式扩展篇
|
10月前
|
SQL 数据可视化 网络安全
YashanDB分布式可视化部署
本文介绍YashanDB的分布式部署流程,涵盖服务端安装、数据库基本信息与服务器配置、节点信息设置、建库参数调整、环境变量配置及安装结果检查等步骤。通过可视化Web界面操作,详细说明了各环节配置方法和注意事项,确保用户顺利完成数据库集群的搭建与初始化设置。适用于需要分布式数据库部署的场景,提供全面的操作指导。
YashanDB分布式可视化部署