开发者社区> 问答> 正文

HBase一般情况下怎么预分区

HBase一般情况下怎么预分区

展开
收起
hbase小能手 2018-11-07 16:22:01 5835 0
3 条回答
写回答
取消 提交回答
  • 这命令是2.0的吧。Hbase1.2是没有 NUMREGIONS , SPLITALGO 这两个参数的

    2019-07-17 23:12:44
    赞同 展开评论 打赏
  • 专注在大数据分布式计算、数据库及存储领域,拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验,6年云智能大数据产品技术一号位经验,10年技术团队管理经验;云智能技术架构/云布道师; 研发阿里历代的大数据技术产品包括ODPS、DLA、ADB,最近五年主导宽表引擎研发、DLA、ADB湖仓研发;

    可以参考 : https://help.aliyun.com/document_detail/71787.html?spm=a2c4g.11186623.6.572.1c413375kzX7Hc

    初次接触HBase的客户,在创建HBase表的时候,不指分区的数目,另外就是rowkey设计不合理,导致热点。

    最为常见的建表语句为:

    create ‘t3’,’f1’, { NUMREGIONS => 50, SPLITALGO => ‘HexStringSplit’ , COMPRESSION => ‘snappy’}

    其中 NUMREGIONS 为 region的个数,一般取10-500左右,集群规模大,可以取大一些,
    SPLITALGO 为 rowkey分割的算法:Hbase自带了两种pre-split的算法,分别是 HexStringSplit 和 UniformSplit,HexStringSplit 如果我们的row key是十六进制的字符串作为前缀的,就比较适合用HexStringSplit,关于rowkey的设计可以参考:RowKey设计
    COMPRESSION压缩算法,参考:数据压缩与编码

    2019-07-17 23:12:44
    赞同 1 展开评论 打赏
  • 社区管理员

    可以参考:https://help.aliyun.com/docume ... QAEPp

    2019-07-17 23:12:44
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据时代的存储 ——HBase的实践与探索 立即下载
Hbase在滴滴出行的应用场景和最佳实践 立即下载
阿里云HBase主备双活 立即下载