客户之声为你探究PB级云数据库HBase

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 阿里云在近期推出了云HBase产品,客户使用情况如何?此款产品的内核在集团内部已经使用了6年之久,那么跟社区版本的HBase有怎样的区别,我们又做了怎样的产品化;本专题将会为你详细介绍。

如果有云HBase需求,抢先使用

客户之声

有一家中国领先的车商服务平台,最近在使用云HBase,在实时业务线中,要处理 TB 级的的数据量,同时又要保证读写的效率,在数据库的选择上。经过多重考虑,最终决定采用阿里云HBase 来处理这些数据。


选择阿里云HBase主要基于以下考虑:


1、数据整体的技术栈都是基于Hadoop
HBase是Apache的Hadoop项目的子项目,阿里云HBase完全兼容Apache HBase 的接口,选择阿里云HBase可以更好的同其他组件集成,例如:Spark可以方便读写HBase中的数据;通过 Flume可以将Kafka中的数据写入阿里云 HBase。


2、阿里云HBase可以提供更强大的查询功能
阿里云HBase 完全兼容了社区版本的接口, HBase中原有丰富的过滤器仍可以使用在阿里云 Hbase。同时社区中Phoneix等SQL方案也在逐渐成熟, 后期SQL ON HBase 也有更多的选择。


3、由阿里云承担基础运维, 服务更有保障
HBase要提供线上服务, 服务稳定性的要求更高。对于没有运维经验的团队来说, 阿里云 HBase 是更好的选择。这个也是吸引我们使用阿里云 HBase 最主要的原因。阿里云承诺99.95%的稳定性及9个9的数据可靠性,超过自己可以实现的运维能力。


于是在调研后, 首先被应用到阿里云HBase上的业务是一个新业务:基础服务中的 GIS 服务。存储了大量GPS上报的地理位置数据, 并提供风控后台的数据接口。

TB1bcw4PVXXXXXiapXXXXXXXXXX-828-521.png


使用中的反馈


现在生产数据上线只有两周, 日写入数据GB级别,总体感觉目前系统还没有出现运维问题,解决了后顾之忧,而且与社区版本完全兼容,避免了不必要的工作量。创业公司的时间就是金钱,这里点一个大大的赞。 
经过这次尝试,阿里云的HBase的成绩有目共睹,后续公司内的实时业务也会陆续从自建的HBase迁移到阿里云HBase 中,减少运维的风险。

云HBase介绍


云HBase的内核,是基于开源社区1.1版本系列,在此之上深度改造,之前阿里在较早版本有较多的优化也会渐渐迁移到此版本中。目前服务了整个集团的大数据结构化存储需求。如: 
1、平台类:如目前很流行的kylin,日志同步工具TT,图组件Titan等。此类存放的是平台类数据,作为平台的底层存储使用。 
2、用户行为类:如淘宝收藏夹、交易数据、聊天记录、物联网数据等。这里使用比较直接,就直接存放HBase,再读取。 
3、报表类:比如报表、数据大屏等

TB13jbiPFXXXXX5XVXXXXXXXXXX-868-396.png


随着互联网的发展,我们遇到很多中小公司,都有数T、数P的HBase集群,且这些集群没有改动过一行HBase源代码,出现问题后无从下手,导致服务长时间不可用甚至面临数据丢失的风险,更加不会去改造HBase以满足日益增长业务需求。 

云HBase团队,源于对内核的深度改造,满足日益复杂化、多样化的大数据存储需求。阿里从2011年初开始步入HBase的发展、建设之路,是国内最早应用、研究、发展、回馈的团队,也诞生了HBase社区在国内的第一位Committer,成为HBase在中国发展的积极布道者 过去的几年时间,阿里累积向社区回馈了上百个Patch, 在诸多核心模块的功能、稳定性、性能作出积极重大的贡献,拥有多位Committer,成为推动HBase的长远发展的重要力量之一。

云HBase建设


主要是两个体系


管控体系:由于我们有数千个、甚至数万个HBase集群,所以,我们必须是自动化的。这个体系建设的是怎么去管控好上万级HBase集群,为数万家公司提供云HBase的服务。 
内核建设:目前云HBase主要围绕云上构建HBase,需要充分利用云的优势,比如:弹性、资源无限、随时随地、默认有多个可用区及多个地区。我们主要围绕:性能、运维、成本、安全、可用性、功能等方案建设内核。

TB1ueC8PFXXXXaJaXXXXXXXXXXX-901-346.png


以上内容是否对你有帮助, 查看云数据库HBase
关于更多的云HBase的讨论,可加入HBase钉钉群:
32bdb37770f15e0b6c93c7794e5571265ece14bf

相关实践学习
lindorm多模间数据无缝流转
展现了Lindorm多模融合能力——用kafka API写入,无缝流转在各引擎内进行数据存储和计算的实验。
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
6月前
|
存储 分布式计算 大数据
HBase分布式数据库关键技术与实战:面试经验与必备知识点解析
【4月更文挑战第9天】本文深入剖析了HBase的核心技术,包括数据模型、分布式架构、访问模式和一致性保证,并探讨了其实战应用,如大规模数据存储、实时数据分析及与Hadoop、Spark集成。同时,分享了面试经验,对比了HBase与其他数据库的差异,提出了应对挑战的解决方案,展望了HBase的未来趋势。通过Java API代码示例,帮助读者巩固理解。全面了解和掌握HBase,能为面试和实际工作中的大数据处理提供坚实基础。
368 3
|
20天前
|
存储 NoSQL MongoDB
基于阿里云数据库MongoDB版,微财数科“又快又稳”服务超7000万客户
选择MongoDB主要基于其灵活的数据模型、高性能、高可用性、可扩展性、安全性和强大的分析能力。
|
5月前
|
分布式计算 Java Hadoop
杨校老师课堂之分布式数据库HBase的部署和基本操作
杨校老师课堂之分布式数据库HBase的部署和基本操作
59 0
|
3月前
|
存储 SQL 分布式数据库
|
5月前
|
存储 NoSQL Java
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
90 0
|
5月前
|
存储 分布式计算 Hadoop
【大数据】分布式数据库HBase下载安装教程
【大数据】分布式数据库HBase下载安装教程
127 0
|
5月前
|
存储 缓存 大数据
【大数据】分布式数据库HBase
【大数据】分布式数据库HBase
110 0
|
6月前
|
存储 Java 分布式数据库
【分布式计算框架】HBase数据库编程实践
【分布式计算框架】HBase数据库编程实践
99 1
|
6月前
|
存储 分布式计算 Java
大数据存储技术(3)—— HBase分布式数据库
大数据存储技术(3)—— HBase分布式数据库
1386 0
|
6月前
|
存储 分布式计算 Hadoop
基于Hadoop分布式数据库HBase1.0部署及使用
基于Hadoop分布式数据库HBase1.0部署及使用