Hive 工作原理详解
什么是Hive?
Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。
CentOS7下安装CDH,clouderamanager,hadoop
一、实验背景
我们是四台电脑一起搭建Hadoop集群
A,B,C,D四个人个有一台电脑,分别在各自的电脑上安装虚拟机,虚拟机装centOS7。(我们建议主机namenode内存大一点8g,硬盘最好100g以上,其余节点2g,50g即可,下文会阐述原因)
系统:VMware下的centOS7
jdk:1.