regionserver管理着多个region,每个region中有多个hstore组成,每个hstore对应表中的column family中的存储,hstore是hbase存储的核心,由memstore和stroefile组成,当memstore满了之后会flush到storefile中.
region下面的某个storefile过大之后,就会进行split操作. 多个列族会形成更多的hfile小文件 不同列族会共享region,split操作会导致io增加. 一个列族触发flush时,其它列族也会进行flush,导致io压力增加 会形成更多小文件,增加hdfs压力 查询CF时,会出现跨多个region,查询效率变低 多个CF会有多个Memstore,内存占用增大.
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。