Locality对HBase的读取性能有什么影响?
某些服务可能和DataNode部署在同一批机器上。因为DataNode本身需要消耗的内存资源和CPU资源都非常少,主要消耗网络带宽和磁盘资源。而HBase的RegionServer服务本身是内存和CPU消耗型服务,于是我们把RegionServer和DataNode部署在一批机器上。对某个DFSClient来说,一个文件在这台机器上的locality可以定义为:
locality =该文件存储在本地机器的字节数之和 / 该文件总字节数
因此,locality是[0, 1]之间的一个数,locality越大,则读取的数据都在本地,无需走网络进行数据读取,性能就越好。反之,则性能越差。
资料来源:《HBase原理与实践》,文章链接:https://developer.aliyun.com/article/724670
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。