Hive----基本操作

简介: 基本操作

hive中创建一张表:

create table student5(id int,name String);              --hql语言中,对大小写不敏感

insert into table student values(1001,"lilei");

 

将本地的离线数据文件导入到表中:

load data local inpath "/opt/module/datas/student.txt" into table student;

 

hive表默认分隔符:

字段:'\001'                 ^A                ctrl + v        ctrl + a

集合元素:'\002'

map的kv:'\003'

 

建表时规定分隔符:

create table student2(id int,name String)        

row format delimited fields terminated by '\t'     --字段之间分隔符

collection items terminated by ','                --集合元素之间

map keys terminated by ':';                       --map类型的kv之间        

 

hive的数据位置默认在 /user/hive/warehouse下

hive的表在hdfs中以目录的形式存在,数据在目录下以文件形式存在

库:hive的库在hdfs中以库名.db目录存在,库下的表以子目录形式存在

 

hive的元数据默认存放在自带的derby数据库中,derby数据库不允许多客户端访问

derby会在当前启动hive的目录下产生元数据文件,如果下次启动的位置不同,就读不到之前的数据

弃用derby,将元数据存放在mysql

目录
相关文章
|
8月前
|
SQL 存储 分布式计算
Hive 基本操作(创建数据库与创建数据库表)
Hive 基本操作(创建数据库与创建数据库表)
229 0
|
SQL 分布式计算 Hadoop
云计算与大数据实验八 Hive的安装与基本操作
云计算与大数据实验八 Hive的安装与基本操作
182 0
|
SQL Linux 数据库
Hive中SQL基本操作
Hive中SQL基本操作
|
SQL 存储 分布式计算
Hive概论、架构和基本操作
Apache Spark是一个快速的,多用途的集群计算系统,相对于Hadoop MapReduce将中间结果保存在磁盘中,Spark使用了内存保存中间结果,能在数据尚未写入硬盘时在内存中进行计算,同时Spark提供SQL支持。Hive是建立在Hadoop上的数据仓库基础架构,它提供了一系列的工具,可以存储、查询、分析存储在分布式存储系统中的大规模数据集。Hive定义了简单的类SQL查询语言,通过底层的计算引擎,将SQL转为具体的计算任务进行执行。它将计算分为两个阶段,分别为Map和Reduce。
252 0
|
SQL 存储 数据挖掘
HIVE 表 DLL 基本操作(一)——第2关:Create/Drop/Truncate 表任务描述
HIVE 表 DLL 基本操作(一)——第2关:Create/Drop/Truncate 表任务描述
687 0
|
SQL 存储 Linux
HIVE 表 DLL 基本操作(一)——第1关:Create/Alter/Drop 数据库
HIVE 表 DLL 基本操作(一)——第1关:Create/Alter/Drop 数据库
1053 0
|
SQL 存储 分布式计算
【大数据基础实践】(六)数据仓库Hive的基本操作
目录 1. 数据仓库概念 2. Hive简介 2.1 简介 2.2 特性 2.3 生态系统 3. Hive系统架构 4. HQL转成MapReduce作业的原理 4.1 join的实现原理 4.2 group by的实现原理 5. 实验练习 5.1 环境配置 5.1.1 HIVE 5.1.2 MYSQL 5.1.3 配置MySql为hive元数据存储数据库 5.2 Shell进行实验内容 5.2.1 新建一个数据库; 5.2.2 新建表 5.2.3 添加分区 5.2.4 导入grade_zqc 5.2.5 统计男、女生人数 5.2.6 统计每个学生所有科目的总分以及平均分
777 0
【大数据基础实践】(六)数据仓库Hive的基本操作
|
SQL 存储 分布式计算
Hive表的基本操作
create table语句遵从sql语法习惯,只不过Hive的语法更灵活。例如,可以定义表的数据文件存储位置,使用的存储格式等。
610 0
|
SQL 缓存 分布式计算
|
SQL 关系型数据库 Java