企业打开云HBase的正确方式,来自阿里云云数据库团队的解读

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 Tair(兼容Redis),内存型 2GB
简介: 一、HBase的历史由来 HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

一、HBase的历史由来

HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。

在大批知名公司的推动下,以及结合HBase自身的能力,HBase应用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域
image

二、HBase普及和应用难点

整个Hadoop技术体系也不知不觉的走过了10年的青葱岁月,但相比关系型数据库超过40年的发展,还显得稚嫩。相比成熟的关系型数据库,HBase的普及和应用,有以下难点:

  • 生产部署至少4个节点,起步成本高。
  • 原始只有API接口,偏底层,需要较强编程功底。
  • 技术资料少。
  • 社区活动少。

三、技术平民化,阿里云HBase团队在行动

为了普及和推广HBase生态,降低HBase使用难度,让更多的公司享受到HBase技术红利。

阿里云HBase团队在产品,生态,客户服务方面积极投入,希望通过微薄的力量造福整个中国HBase技术生态,让HBase技术平民化,让那些只有大公司才玩的起的技术真正走进SME,校园和广大开发者。

1、推出云HBase单节点版本,极低成本,降低使用门槛

阿里云云HBase服务正式推出单节点版本,欢迎访问https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多。

HBase单节点版本是在集群版本的基础上推出的基础版本,相比集群版本的4个节点起步,单节点版本HBase服务全部部署在一个节点上,因此单节点版本价格非常低。同时单节点是具备小规模生产能力的,具备纵向伸缩能力,提供11个9的数据集可靠性和2个9的服务可用性,所以单节点版本非常适合开发、测试以及非核心业务小规模生产环境。

HBase单节点有以下特点:

  • 体验一致 :和云数据库HBase集群版本各种操作,监控体验一致
  • 低成本 :年度爆款,99元/3月,399元/年
  • 高性能:深度内核优化,性能高于社区版本50%-200%
  • 弹性灵活:多种规格选择,未来支持实例升级变配,选择灵活

2、提供SQL能力,造福广大DBA和开发者

过于底层的API,使得HBase使用起来难度巨大。相比原生API,SQL能力是广大DBA和开发者提升开发和使用效率的利器,云HBase服务默认包含Phoneix服务。
Phoenix是一个开源的HBASE SQL层。它不仅可以使用标准的JDBC API替代HBASE client API创建表,插入和查询HBASE,也支持二级索引、事务以及多种SQL层优化。
另外,我们在云栖社区中推出一系列专业文章,帮助HBase用户很好的理解和使用HBase和Phoenix:Phoenix系列文章。此系列文章将会从Phoenix的语法和功能特性、相关工具、实践经验以及应用案例多方面从浅入深的阐述。希望对Phoenix入门、在做架构设计和技术选型的同学能有一些帮助。
另外,功能更强大和完善的HBase SQL能力也持续研发中,HBase使用难度会进一步降低,适应场景更加广泛。

3、回馈社区,积极推动社区发展

阿里由于业务上的需要,内部深度使用HBase,内部集群规模整体超过12000台,单集群超过1000台。在长期的实践和使用中,也培养了大量的专家,积累了雄厚的技术实力,目前拥有 3 HBase PMC、6 Committer、数十位内核贡献者。我们在收获社区的技术支持的同时,也积极回馈社区,给社区贡献超过 200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。除了产品上,我们在社区的推广和建设中也积极投入人力和物力。


- 主办Apache HBasecon Asia 2018大会

HBaseCon大会是Apache HBase™官方举办的技术会议,发起于2012年,是HBase技术人员的盛会。阿里云主办2018届HBase亚洲大会,大会预计在下半年举行,我们会在第一时间公布在技术社区中。欢迎广大HBase技术爱好者关注。

- 打造HBase中文社区,完善HBase中文资料

HBase发源于美国,发源于社区,所以存在资料不完善,核心资料都是英文的问题,进一步加大了开发人员学习和掌握HBase的难度。
云HBase团队联合国内众多大公司的研发leader,HBase社区PMC,推出HBase中文社区,打造一个技术人员的技术交流家园,组织广大的社区爱好者积极分享HBase技术文章,共同促进HBase技术氛围的形成。也欢迎更多的同学加入HBase技术社区,一起营造HBase技术家园。

4、一颗公益之心,义务抢救客户数据

4.13日,某公司使用自建一个HBase集群挂了!整个集群有30+T 业务数据,是公司的数据中心,集群直接启动不了。他们也是经历了熬战一天一夜的情况下,依旧没有解决恢复,还曾有过重装集群重导数据念头。最后,通过钉钉HBase技术交流群找到阿里云的技术团队同学。技术同学立刻自发组成抢救小分队,尽力最大的努力,使用最低风险的方式,抢救最完整的集群。

事后,技术负责人王华激动的表示:非常感谢阿里大牛的帮助,协助我们解决了关键问题,避免了30TB业务数据遗失的重大损失。

感谢这群单纯的技术人,让HBase技术社区有温度!

四、写到最后

一项技术的发展和成熟,都要经历无数的技术人员,无数个日夜,不眠不休持续奋战。也需要集全社会的力量,更多的公司一起参与进来共同打造更好的产品和更好的生态。

阿里云HBase团队希望通过这些星星之火,点燃HBase以及整个Hadoop技术生态的草原。

普及HBase,阿里云HBase团队在行动!

相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
2月前
|
安全 NoSQL 关系型数据库
阿里云数据库:助力企业数字化转型的强大引擎
阿里云数据库:助力企业数字化转型的强大引擎
|
6月前
|
分布式计算 Java Hadoop
杨校老师课堂之分布式数据库HBase的部署和基本操作
杨校老师课堂之分布式数据库HBase的部署和基本操作
61 0
|
2月前
|
存储 NoSQL MongoDB
小川科技携手阿里云数据库MongoDB:数据赋能企业构建年轻娱乐生态
基于MongoDB灵活模式的特性,小川实现了功能的快速迭代和上线,而数据库侧无需任何更改
|
2月前
|
运维 NoSQL BI
简道云搭载阿里云MongoDB数据库,帮助数以万计企业重构业务系统
通过与MongoDB和阿里云团队的合作,让简道云少走了弯路,保障了线上服务的长期稳定运行,提高了吞吐效率,并相应降低了线上运行成本
|
2月前
|
NoSQL 关系型数据库 OLAP
如何选择最合适的数据库,帮助企业及个人业务更好的开展
如何选择最合适的数据库,帮助企业及个人业务更好的开展
|
4月前
|
存储 SQL 分布式数据库
|
5月前
|
存储 运维 NoSQL
现代化企业管理中的数据库选择与优化策略
在当今信息化时代,企业管理越来越依赖于高效的数据库系统来支撑业务运作。本文探讨了在选择和优化数据库时需要考虑的关键因素,包括数据类型、访问模式以及性能需求。通过分析不同数据库系统的特性和优劣势,帮助企业在面对日益复杂的业务需求时,选择合适的数据库解决方案,提升管理效率和业务运行质量。
|
5月前
|
NoSQL Cloud Native Redis
|
7月前
|
Cloud Native 数据管理 关系型数据库
【阿里云云原生专栏】云原生数据管理:阿里云数据库服务的分布式实践
【5月更文挑战第21天】阿里云数据库服务在云原生时代展现优势,应对分布式数据管理挑战。PolarDB等服务保证高可用和弹性,通过多副本机制和分布式事务确保数据一致性和可靠性。示例代码展示了在阿里云数据库上进行分布式事务操作。此外,丰富的监控工具协助用户管理数据库性能,支持企业的数字化转型和业务增长。
233 1
|
6月前
|
存储 NoSQL Java
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
104 0