HBase常用命令详解基于hbase shell的增删改查操作-开发者社区-阿里云

HBase系列学习：基础知识

2024-10-16 720

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： HBase系列学习：基础知识

基本介绍

HBase官网：hbase.apache.org/

Apache HBase 是 Hadoop中一个支持分布式的、可扩展的大数据存储的数据库。

当需要对大数据进行随机、实时读/写访问时，可以用 Apache HBase。

HBase特点

列式存储:

HBase是面向列族的非关系型数据库，每行数据列都可以不同，并且列可以按照需求进行动态增加。

因此在开始创建HBase表时，可以只创建列族，等需要时再创建相应的列。

数据压缩：

列式存储意味着数据往往类型相同，可以采用某种压缩算法进行统一的压缩存储。

海量存储:

HDFS支持的海量存储，存储PB级数据仍能有百毫秒内的响应速度。

基本操作

Shell操作

进入HBase客户端命令操作界面：

hbase shell

查看帮助命令:

hbase(main):001:0> help

查看当前数据库中有哪些表:

hbase(main):006:0> list

创建一张表:

创建user表，包含base_info、extra_info两个列族

hbase(main):007:0> create 'user', 'base_info', 'extra_info'
create 'user', {NAME => 'base_info', VERSIONS => '3'}，{NAME => 'extra_info'}

添加数据操作:

向user表中插入信息，row key为 rk0001，列族base_info中添加name列标示符，值为zhangsan

hbase(main):008:0> put 'user', 'rk0001', 'base_info:name', 'zhangsan'

向user表中插入信息，row key为rk0001，列族base_info中添加age列标示符，值为20

hbase(main):010:0>  put 'user', 'rk0001', 'base_info:age', 20

查询数据:

通过rowkey进行查询:

获取user表中row key为rk0001的所有信息

hbase(main):006:0> get 'user', 'rk0001'

查看rowkey下面的某个列族的信息:

获取user表中row key为rk0001，base_info列族的所有信息

hbase(main):007:0> get 'user', 'rk0001', 'base_info'

查看rowkey指定列族指定字段的值：

获取user表中row key为rk0001，base_info列族的name、age列标示符的信息

hbase(main):008:0> get 'user', 'rk0001', 'base_info:name', 'base_info:age'

查看rowkey指定多个列族的信息

获取user表中row key为rk0001，base_info、extra_info列族的信息

hbase(main):010:0> get 'user', 'rk0001', 'base_info', 'extra_info'
hbase(main):011:0> get 'user', 'rk0001', {COLUMN => ['base_info', 'extra_info']}
hbase(main):012:0> get 'user', 'rk0001', {COLUMN => ['base_info:name', 'extra_info:address']}

指定rowkey与列值查询：

获取user表中row key为rk0001，cell的值为zhangsan的信息

hbase(main):013:0> get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'binary:zhangsan')"}

指定rowkey与列值模糊查询:

获取user表中row key为rk0001，列标示符中含有a的信息

hbase(main):015:0> get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

插入一批数据:

hbase(main):016:0> put 'user', 'rk0002', 'base_info:name', 'fanbingbing'
hbase(main):017:0> put 'user', 'rk0002', 'base_info:gender', 'female'
hbase(main):018:0> put 'user', 'rk0002', 'base_info:birthday', '2000-06-06'
hbase(main):019:0> put 'user', 'rk0002', 'extra_info:address', 'Shanghai'

查询所有数据:

查询user表中的所有信息

hbase(main):020:0> scan 'user'

列族查询:

查询user表中列族为 base_info 的信息

Scan：

设置是否开启Raw模式，开启Raw模式会返回包括已添加删除标记但是未实际删除的数据。

VERSIONS指定查询的最大版本数。

hbase(main):021:0> scan 'user', {COLUMNS => 'base_info'}
hbase(main):022:0> scan 'user', {COLUMNS => 'base_info', RAW => true, VERSIONS => 5}

多列族查询：

查询user表中列族为info和data的信息。

hbase(main):023:0> scan 'user', {COLUMNS => ['base_info', 'extra_info']}
hbase(main):024:0> scan 'user', {COLUMNS => ['base_info:name', 'extra_info:address']}

指定列族与某个列名查询：

查询user表中列族为base_info、列标示符为name的信息。

hbase(main):025:0> scan 'user', {COLUMNS => 'base_info:name'}

指定列族与列名以及限定版本查询:

查询user表中列族为base_info、列标示符为name的信息，并且版本最新的5个

hbase(main):026:0> scan 'user', {COLUMNS => 'base_info:name', VERSIONS => 5}

指定多个列族与按照数据值模糊查询：

查询user表中列族为 base_info 和 extra_info且列标示符中含有a字符的信息

hbase(main):027:0> scan 'user', {COLUMNS => ['base_info', 'extra_info'], FILTER => "(QualifierFilter(=,'substring:a'))"}

rowkey的范围值查询:

查询user表中列族为info，rk范围是[rk0001, rk0003)的数据

hbase(main):028:0> scan 'user', {COLUMNS => 'base_info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

指定rowkey模糊查询:

查询user表中row key以rk字符开头的

hbase(main):029:0> scan 'user',{FILTER=>"PrefixFilter('rk')"}

更新数据值：

把user表中rowkey为rk0001的base_info列族下的列name修改为zhangsansan

hbase(main):030:0> put 'user', 'rk0001', 'base_info:name', 'zhangsansan'

指定rowkey以及列名进行删除:

删除user表row key为rk0001，列标示符为 base_info:name 的数据

hbase(main):032:0>  delete 'user', 'rk0001', 'base_info:name'

指定rowkey，列名以及字段值进行删除：

删除user表row key为rk0001，列标示符为base_info:name，timestamp为1392383705316的数据

hbase(main):033:0> delete 'user', 'rk0001', 'base_info:age', 1564745324798

删除 base_info 列族

hbase(main):034:0> alter 'user', NAME => 'base_info', METHOD => 'delete'
hbase(main):035:0> alter 'user', 'delete' => 'base_info'

删除user表数据：

hbase(main):036:0> truncate 'user'

删除user表：

#先disable  再drop
hbase(main):036:0> disable 'user'
hbase(main):037:0> drop 'user'
#如果不进行disable，直接drop会报错
ERROR: Table user is enabled. Disable it first.

数据模型

逻辑结构:

物理架构：

Rowkey（行键）:

Table 的主键，Table 中的记录按照 Rowkey 的字典序进行排序。

Column Family（列族）：

表中的每个列，都归属与某个列族。

列族是表的 Schema 的一部分，必须在使用表之前定义。

Timestamp（时间戳）：

每次数据操作对应的时间戳，可以看作是数据的 Version 版本号。

Column（列）：

列族下面的具体列。

属于某一个 ColumnFamily，类似于 MySQL 当中创建的具体的列。

Cell（单元格）：

由{rowkey, column, version} 唯一确定的单元。

Cell 中的数据没有类型，全部是以字节数组进行存储。

HBase系列学习：基础知识

基本介绍

基本操作

数据模型

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

HBase系列学习：基础知识

基本介绍

基本操作

数据模型

热门文章

最新文章

相关课程

相关电子书