Hologres 比特编码列设置和字典编码列设置分别要注意什么?
比特编码列 bitmap columns 也是对 Hologres 性能来说非常重要的一个属性,通过 bitmap_columns 指定比特编码列,Hologres 会在这些列上构建比特编码,相当于把数 据与对应的行号做一个映射。 bitmap 可以对 segment 内部的数据进行快速过滤,因此建议把 filter 条件的数据建成 比特编码。 目前 Hologres 会默认所有 text 列都会被隐藏式地设置到 bitmap_columns 中。 但是只有列存表支持比特编码列。字典编码主要是对一些字符串类型的列生成字典编码。用户通过设置 dictionary_ encoding_columns 指定字典编码列,Hologres 将为指定列的值构建字典映射。字典编 码可以将字符串的比较转成数字的比较,加速 group by 查询,因此建议用户将 group by 的字段都建成 dictionary_encoding_columns,但是不建议将基数高的列建为 dictionary_encoding_columns,会导致查询性能变差。Hologres 默认所有 text 列都 会被隐式地设置到 dictionary_encoding_columns 中,另外需要注意只有列存表支持字 典编码列。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
本技术圈将为大家分析有关阿里云产品Hologres的最新产品动态、技术解读等,也欢迎大家加入钉钉群--实时数仓Hologres交流群32314975