Apache Hive--DDL--创建表--数据类型&分隔符| 学习笔记

简介: 快速学习Apache Hive--DDL--创建表--数据类型&分隔符

开发者学堂课程【大数据Hive教程精讲Apache Hive--DDL--创建表--数据类型&分隔符】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/90/detail/1367


Apache Hive--DDL--创建表--数据类型&分隔符


内容介绍:

一、Apache Hive--DDL--创建表--数据类型&分隔符


一、Apache Hive--DDL--创建表--数据类型&分隔符

1、创建表

建表语法

CREATE[EXTERNAL]TABLE [IF NOT EXISTS] table_name

[(col_name data_type [COMMENT col_comment],..)]

[COMMENT table_comment]

[PARTITIONED BY (col_name data_type [COMMENT col_comment], .)]

[CLUSTERED BY (col_name, col_name, ...)

[SORTED BY (col_name [ASC|DESC], .)] INTO num_buckets BUCKETS]

[ROW FORMAT row_format]

[STORED AS file_format]

[LOCATION hdfs_path]


2、说明:

CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;

用户可以用 IF NOT EXISTS 选项来忽略这个异常。

10.png

Misc Types

l  BOOLEAN

l  BINARY(Note: Only available starting with Hive 0.8.0)

complex Types

l  arrays: ARRAY(Note: negative values and non-constant expressions are allowed as of Hive 0.14.).

l  maps: MAPdata_type(Note: negative values and non-constant expressions are allowed asof Hive 0.14.)

l  structs: STRUCT

l  union:UNIONTYPEdata_type...>(Note: Only available starting with Hive 0.7.0.)

Column Types

lntegral Types (TINYINT,SMALLINTINT/INTEGER, BIGINT)

Integral literals are assumed to be INT by default, unless the number exceeds the range of INT in which case it isinterpreted as a BIGINT, or if one of the following postfixes is present on the number.

11.png


3、Strings

String literals can be expressed with either single quotes () or double quotes (").Hive uses C-style escaping within thestrings.

Node-1:

[root@node-1   hivedata]# hadoop fs -cp /hivedata/1.txt /user/hive/warehouse/itcast.db/t_t1

[root@node-1   hivedata]# hadoop fs -cp /hivedata/1.txt /user/hive/warehouse/itcast.db/t_t2

[root@node-1   hivedataj# vi a.txt

[FIELDS   TERMINATED BY char]

[COLLECTION   ITEMS TERMINATED BY char][MAP KEYS TERMINATED BY char]

[LINES   TERMINATED BY char] | SERDE serde_name[WITH SERDEPROPERTIES

(property_name=property_value,   property_name=property_value,.)]

ROW FORMAT DELIMITED

hive建表的时候默认的分割符是’\001',若在建表的时候没有指明分隔符,load 文件的时候文件的分隔符需要是'\001';若文件分隔符不是'001',程序不会报错,但表查询的结果会全部为'null';

Hive sql 语句:

12.png


4、复杂类型的数据表指定分隔符:

create   table complex_array(name string ,work_locations array) ROW   FORMAT DELIMITED FIELDS

zhangsanbeijing,   shanghai,tianjin,hangzhouwangwu shanghai,chengdu, wuhan, haerbin

create   table t_map(id int,name string, hobby map)row format   delimited

fields   terminated by ','

collection   items terminated by '-'map keys terminated by ':' ;

1,zhangsan,唱歌:非常喜欢-跳舞:喜欢-游泳:一般般

2,lisi,打游戏:非常喜欢-篮球:不喜欢


5、内部表、外部表

建内部表

create table student (Sno int,Sname string,sex string,sage int , sdept string) row format delimited 建外部表

课堂笔记:

1hive 建立一张表跟已经存在的结构化的数据文件产生映射关系

映射成功之后,就可以通过写 sql 来分析这结构化的数据避免了写mr程序的麻烦

2、数据库---/user/hive/warehouse 下的一个文件夹对应

---》数据库文件夹下面的子文件夹/user/hive/warehouse/itcast.db/t_t1表的数据位置目前不能随便存放一定要在指定的数据库表的文件夹下面

建立表的时候可能还需要指定分隔符否则有可能映射不成功

3、建表的时候一定要根据结构化数据文件的分隔符类型指定分隔符

建表的字段个数和字段类型要跟结构化数据中的个数类型一致

分隔符一般使用内置的来指定 ROW FORMAT DELIMITED  分割字段还是分割集合

相关文章
|
8月前
|
SQL 存储 HIVE
Hive中的表是如何定义的?请解释表的结构和数据类型。
Hive中的表是如何定义的?请解释表的结构和数据类型。
120 0
|
5月前
|
存储 SQL 分布式计算
Hive 中有多少种数据类型?
【8月更文挑战第12天】
478 4
|
8月前
|
SQL 存储 Java
Hive 特殊的数据类型 Array、Map、Struct
在Hive中,`Array`、`Map`和`Struct`是三种特殊的数据类型。`Array`用于存储相同类型的列表,如`select array(1, "1", 2, 3, 4, 5)`会产生一个整数数组。`Map`是键值对集合,键值类型需一致,如`select map(1, 2, 3, "4")`会产生一个整数到整数的映射。`Struct`表示结构体,有固定数量和类型的字段,如`select struct(1, 2, 3, 4)`创建一个无名结构体。这些类型支持嵌套使用,允许更复杂的结构数据存储。例如,可以创建一个包含用户结构体的数组来存储多用户信息
765 0
|
8月前
|
SQL 存储 分布式计算
Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表(部分图片来源于网络)
【4月更文挑战第6天】Hive【基础 01】核心概念+体系架构+数据类型+内容格式+存储格式+内外部表(部分图片来源于网络)
163 1
|
SQL 存储 大数据
更改 HIVE 表字段数据类型有哪些注意事项?
更改 HIVE 表字段数据类型有哪些注意事项?
|
存储 SQL HIVE
数据仓库的Hive的数据类型的复杂数据类型的map
在数据仓库领域,Hive是一个常用的工具。它提供了一种简单的方式来查询和分析大量数据。
211 0
|
存储 SQL 分布式计算
数据仓库的Hive的数据类型的基本数据类型的整型
在数据仓库领域,Hive是一个常用的工具。它是一个基于MapReduce的开源数据仓库,可以处理大规模的数据集。Hive中的数据类型是一个重要的话题,因为它们决定了数据如何被存储和处理。在本文中,我们将探讨Hive中的整型数据类型。
158 0
|
8月前
|
SQL JSON 算法
hive学习笔记
hive学习笔记
|
8月前
|
SQL 分布式计算 Hadoop
Hadoop学习笔记(HDP)-Part.15 安装HIVE
01 关于HDP 02 核心组件原理 03 资源规划 04 基础环境配置 05 Yum源配置 06 安装OracleJDK 07 安装MySQL 08 部署Ambari集群 09 安装OpenLDAP 10 创建集群 11 安装Kerberos 12 安装HDFS 13 安装Ranger 14 安装YARN+MR 15 安装HIVE 16 安装HBase 17 安装Spark2 18 安装Flink 19 安装Kafka 20 安装Flume
234 1
Hadoop学习笔记(HDP)-Part.15 安装HIVE
|
8月前
|
存储 SQL 分布式计算
Hadoop(HDFS+MapReduce+Hive+数仓基础概念)学习笔记(自用)
Hadoop(HDFS+MapReduce+Hive+数仓基础概念)学习笔记(自用)
590 0

推荐镜像

更多