备案控制台

开发者社区问答正文

hbase 有些表时不时的查询会变慢，这种问题要从什么方向入手排查

本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。https://developer.aliyun.com/article/706511 点击链接欢迎加入感兴趣的技术领域群。

展开

收起

初商 2019-08-16 21:19:54 1667 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

问问小秘

1、首先你有没有那么多台服务器的集群，如果只是几台，你要想够不够，你的hbase 有几百亿，那么你hdfs上的数据可能要有两个备份，你这几百亿条是如何生成的，肯定是mapreduce跑出来导入到hbase中把，那么原始数据你要不要留，如果留，加上备份就要三份，所以节点的多少要确定。 2、几百亿其实挺多的，hbase 的设计一定要跟你的业务相关，hbase他不能完全像关系型数据库那样去随意查询，到达一定量级，如果设计的不好也是非常之慢的，甚至将hbase搞到崩溃。所以你先去网上看看rowkey的设计原则，比如长度原则等等，然后根据自己业务，哪些查询经常用到，哪些不会用到，想要用hbase实现那种非常灵活的类似关系数据库的查询是不理智的。 3、楼上的兄弟说得对，还有region热点的问题，如果你的hbase数据不是那种每天增量的数据，建议跑个mapreduce对你的数据进行各评判，看看如何能将数据尽可能均匀的分配到每个region中，当然这需要预先分配region 4、几百亿条数据，如果对rowkey进行模糊过滤一定非常非常之慢，所以可以考虑二级索引或者协处理器

答案来源网络，供参考，希望对您有帮助

2019-10-15 19:20:07

赞同展开评论

问答分类：

分布式数据库开发者 Hbase 云数据库HBase版

问答标签：

云数据库HBase版表云数据库HBase版查询

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Flink CDC中除了hive有没有那些引擎支持查询hbase的啊？

233

3

0

DataWorks数据集成支持hbase全表写maxcompute表吗？

81

1

0

hbase查询速度很慢

735

4

0

flinkcdc hbase hive 查询报检查hbase副本没问题，大家有知道这个错？

243

0

0

RichSinkFunction 在自定义写hbase的时候怎么能批量写入不同的表呢？

206

0

0

CDC支持MySQL直接入HBase 吗？HBase 中查询不到数据。

361

1

0

有没有大佬遇见过这个错误。flink查询hive往hbase里面插，过了一会就会报这个错，为什么呢？

545

2

0

大佬们，我实时需求需要查询离线hive表，这个怎么办?只能hive关联hbase?然后去查?

367

1

0

flink-cdc 单表能不能作为source 去关联 hbase表啊？

249

1

0

目前hbase的里面的一张表A已经强制删除了，但是 hbase:meta 表里面的信息删不了，UI界

549

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

全面认识MCP：大模型连接真实世界的“USB-C接口”

协议：怎么设计可扩展且向后兼容的协议？

基于微信小程序的家政服务系统

支持二次开发的移动机器人平台设备盘点与解析

阿里云边缘安全加速ESA免费试用：基础版免费1个月，支持绑定1个站点

还有其他疑问?