一、任务描述
本实验任务主要完成基于ubuntu环境的Hbase单机部署的工作。通过完成本实验任务,要求学生熟练掌握Hbase单机部署的方法,为后续实验的开展奠定Hbase平台基础,也为从事大数据平台运维工程师、大数据技术支持工程师等岗位工作奠定夯实的技能基础。
二、任务目标
1、掌握Hbase单机部署的过程
三、任务环境
Ubuntu、Hbase1.2.6
四、任务分析
Hbase是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统“。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase有三种模式:单机模式,伪分布式模式,完全分布式模式。
学会Hbase单机部署的过程。
五、 任务实施
步骤1、Hbase单机模式配置
右击桌面上选择【Open Terminal Here】打开终端。
在弹出的终端中输入【cd /simple/soft】进入软件包的所在文件夹中,并通过【ls】查看文件夹下所有软件。如图1所示。
图1 查看软件包
使用命令【tar -zxvf hbase-1.3.1-bin.tar.gz -C /simple】解压Hbase到simple目录下。如图2所示。
图2 解压hbase软件包
使用【cd /simple】进入软件的所在文件夹中,并通过【ls】查看文件夹下所有软件,然后使用命令【mv hbase-1.2.6 hbase】。如图3所示。
图3 重命名hbase
进入到hbase的conf目录下, 修改vim hbase-env.sh文件。如图4所示。
图4 修改hbase-env.sh文件
进入到hbase的conf目录下, 修改vim hbase-site.xml文件。如图5所示。
图5 修改hbase-site.xml文件
步骤2、启动hbase
进入到hbase bin文件下,通过命令【./start-hbase.sh】来启动服务。如图6所示。
图6 启动hbase
利用jps查看hbase进程。如图7所示。
图7 启动其他节点
进入hbase命令行,查看所有表。如图8所示。
图8 查看所有表
♥ 知识链接
HBase的特点
name | Value |
大 | 一个表可以有上亿行,上百万列。 |
面向列 | 面向列表(簇)的存储和权限控制,列(簇)独立检索。 |
稀疏 | 对于为空(NULL)的列,并不占用存储空间,因此,表可以设计的非常稀疏。 |
无模式 | 每一行都有一个可以排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列。 |
数据多版本 | 每个单元中的数据可以有多个版本,默认情况下,版本号自动分配,版本号就是单元格插入时的时间戳。 |
数据类型单一 | HBase中的数据都是字符串,没有类型。 |
♥ 温馨提示
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。