章节内容
上一节我们完成了:
Hive简介
安装配置
下载、解压等等操作
修改配置
MariaDB 安装
启动配置
建立用户 远程访问 刷新权限
背景介绍
这里是三台公网云服务器,每台 2C4G,搭建一个Hadoop的学习环境,供我学习。
之前已经在 VM 虚拟机上搭建过一次,但是没留下笔记,这次趁着前几天薅羊毛的3台机器,赶紧尝试在公网上搭建体验一下。
注意,如果你和我一样,打算用公网部署,那一定要做好防火墙策略,避免不必要的麻烦!!!
请大家都以学习为目的,也请不要对我的服务进行嗅探或者攻击!!!
但是有一台公网服务器我还运行着别的服务,比如前几天发的:autodl-keeper 自己写的小工具,防止AutoDL机器过期的。还跑着别的Web服务,所以只能挤出一台 2C2G 的机器。那我的配置如下了:
2C4G 编号 h121
2C4G 编号 h122
2C2G 编号 h123
启动Hive
上一节我们配置好了环境,在 h121 节点上。
此时,我们在命令行中执行:
hive
可以看到如下的执行效果
测试Hive
show functions;
执行结果如下图:
修改配置
vim hive-site.xml • 1
增加如下内容:
<!-- 数据默认的存储位置(HDFS) --> <property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> <description>location of default database for the warehouse</description> </property> <!-- 在命令行中,显示当前操作的数据库 --> <property> <name>hive.cli.print.current.db</name> <value>true</value> <description>Whether to include the current database in the Hive prompt.</description> </property> <!-- 在命令行中,显示数据的表头 --> <property> <name>hive.cli.print.header</name> <value>true</value> </property> <!-- 操作小规模数据时,使用本地模式,提高效率 --> <property> <name>hive.exec.mode.local.auto</name> <value>true</value> <description>Let Hive determine whether to run in local mode automatically</description> </property>
修改的结果如下图:
命令测试
hive: set; • 1
可以在 Hive 控制台中,执行操作系统的指令:
!ls; !clear; • 1 • 2
可以在 Hive 控制台中,执行 DFS 的指令:
dfs -ls /; • 1
一些语句
编写一些语句,对 Hive 进行其他简单的测试:
select array(1,2,3); select arr[0] from (select array(1,2,3) arr) tmp; select map('a',1,'b',2,'c',3); select mymap["a"] from (select map('a', 1, 'b', 2, 'c',3) as mymap) tmp; select struct('username1', 7, 1288.68);