GIN 索引代替 bitmap 索引

简介: 使用GIN代替bitmap索引, 减少索引空间开销

在一些数据库系统中, bitmap 索引经常用来给一些具有大量重复值的字段建立索引。 布尔字段(性别)、状态编码等。
相比于使用正常的 B-Tree 索引, Bitmap 显示的非常高效。

PostgreSQL 并不支持bitmap索引, 但是使用GIN索引可以非常好的处理这种冗余度高的字段。GIN 索引的内部结构与bitmap
是非常相似的。它并不是使用bitmap作为索引项,但是在9.4版本中,它使用的是 varbyte 编码,在最好的情况下, 每一个索引
项只需要占用一个字节。之前是使用 2-3个字节用来存放索引项。在早期的版本,是使用6个字节来存放索引条目,但是这相比于
B-Tree 每个索引条目仍然具有非常小的开销。

创建一个表, 并使用一些字段用来填充它。


CREATE TABLE numbers (n int4, mod2 int4);

insert into numbers (n, mod2) select n, n%2 from generate_series(1, 10000000) n;

这里用到了扩展件 btree_gin, 下面为表创建 GIN 索引


create extension btree_gin;

create index numbers_mod2_gin_idx on numbers using gin(mod2);

对比实验, 我们为相同的列创建B-Tree 索引


create index numbers_mod2_btree_idx on numbers using btree (mod2);

检查建立的索引

di+

public | numbers_mod2_btree_idx | index | whatcat | numbers | 214 MB |
public | numbers_mod2_gin_idx | index | whatcat | numbers | 10 MB |


在这里我们可以看到, GIN 索引相比于 B-Tree 索引有20倍小。
目录
相关文章
|
11月前
|
索引
索引
索引。
60 0
|
1月前
|
TensorFlow 算法框架/工具 索引
索引
【8月更文挑战第13天】索引。
21 1
|
4月前
|
存储 NoSQL 关系型数据库
索引!索引!!索引!!!到底什么是索引?
**索引是数据库中的数据结构,类似书籍目录,加速数据查找和访问。优点包括提升查询性能、数据检索速度、支持唯一性约束及优化排序和连接操作。缺点在于增加写操作开销、占用存储空间、高维护成本和过多索引可能降低性能。常见的索引类型有单值、复合、唯一、聚集和非聚集索引等,实现方式涉及B树、B+树和哈希表。B树和B+树适合磁盘存储,B+树尤其适用于范围查询,哈希索引则适用于快速等值查询。**
|
4月前
|
SQL 搜索推荐 关系型数据库
|
4月前
|
安全 关系型数据库 MySQL
合理使用索引
【5月更文挑战第9天】这篇文章探讨了数据库索引的高效使用,包括函数和表达式索引、查找和删除未使用的索引、安全删除索引、多列索引策略、部分索引以及针对通配符搜索、排序、散列和降序索引的特殊技巧。还介绍了部分索引在减少索引大小和处理唯一性约束中的应用,以及PostgreSQL对前导通配符搜索的支持。通过遵循简单的多列索引规则和利用特定类型的索引,如哈希和降序索引,可以显著提高查询性能。
98 0
|
11月前
|
存储 关系型数据库 MySQL
了解和认识索引
了解和认识索引 。
56 0
|
11月前
|
关系型数据库 MySQL 索引
索引(2)
索引(2)。
32 0
|
11月前
|
关系型数据库 MySQL 数据库
了解和认识索引
了解和认识索引。
42 0
|
数据库 索引
请注意这些情况下,你的索引会不生效!
数据库性能优化是确保系统高效运行的关键要素之一。而索引作为提升数据库查询性能的重要工具,在大部分情况下都能发挥显著的作用。然而,在某些情况下,索引可能会失效或不起作用,导致查询性能下降,甚至引发性能瓶颈。
|
存储 缓存 自然语言处理
正排索引
介绍ElasticSearch相关正排索引