同一份数据，Redis为什么要存两次？(一）-阿里云开发者社区

同一份数据，Redis为什么要存两次？(一）

2022-09-08 321

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 同一份数据，Redis为什么要存两次？

前言

在 Redis 中，有一种数据类型，当在存储的时候会同时采用两种数据结构来进行分别存储，那么 Redis 为什么要这么做呢？这么做会造成同一份数据占用两倍空间吗？

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址：https://gitee.com/zhijiantianya/ruoyi-vue-pro

视频教程：https://doc.iocoder.cn/video/

五种基本类型之集合对象

Redis 中的集合对象是一个包含字符串类型元素的无序集合，集合中元素唯一不可重复。

集合对象的底层数据结构有两种：intset 和 hashtable。内部通过编码来进行区分：

编码属性	描述	object encoding命令返回值
OBJ_ENCODING_INTSET	使用整数集合实现的集合对象	intset
OBJ_ENCODING_HT	使用字典实现的集合对象	hashtable

intset 编码

intset（整数集合）可以保存类型为 int16_t，int32_t，int64_t 的整数值，并且保证集合中没有重复元素。

intset 数据结构定义如下（源码 inset.h 内）：

typedef struct intset {
    uint32_t encoding;//编码方式
    uint32_t length;//当前集合中的元素数量
    int8_t contents[];//集合中具体的元素
} intset;

下图就是一个 intset 的集合对象存储简图：

微信图片_20220908133827.png

encoding

在 intset 内部的 encoding 记录了当前整数集合的数据存储类型，主要有三种：

INTSET_ENC_INT16

此时 contents[] 内的每个元素都是一个 int16_t 类型的整数值，范围是：-32768 ~ 32767（-2 的 15 次方 ~ 2 的 15 次方 - 1）。

INTSET_ENC_INT32

此时 contents[] 内的每个元素都是一个 int32_t 类型的整数值，范围是：-2147483648 ~ 2147483647（-2 的 31 次方 ~ 2 的 31 次方 - 1）。

INTSET_ENC_INT64

此时 contents[] 内的每个元素都是一个 int64_t 类型的整数值，范围是：-9223372036854775808 ~ 9223372036854775807（-2 的 63 次方 ~ 2 的 63 次方 - 1）。

`contents[]`

contents[] 虽然结构的定义上写的是 int8_t 类型，但是实际存储类型是由上面的 encoding 来决定的。

整数集合的升级

假如一开始整数集合中的元素都是 16 位的，采用 int16_t 类型来存储，此时需要再存储一个 32 位的整数，那么就需要对原先的整数集合进行升级，升级之后才能将 32 位的整数存储到整数集合内。这就涉及到了整数集合的类型升级，升级过程主要有 4 个步骤：

根据新添加元素的类型来扩展底层数组空间的大小，按照升级后现有元素的位数来分配新的空间。
将现有的元素进行类型转换，并将转换类型后的元素从后到前逐个重新放回到数组内。
将新元素放到数组的头部或者尾部（因为触发升级的条件就是当前数组的整数类型无法存储新元素，所以新元素要么比现有元素都大，要么就比现有元素都小）。
将 encoding 属性修改为最新的编码，并且同步修改 length 属性。

PS：和字符串对象的编码一样，整数集合的类型一旦发生升级，将会保持编码，无法降级。

升级示例

1.假如我们有一个集合存储的 encoding 是 int16_t，内部存储了 3 个元素：

微信图片_20220908133910.png

2.这时候需要插入一个整数 50000，发现存储不下去，而 50000 是一个 int32_t 类型整数，所以需要申请新空间，申请空间大小为 4 * 32 - 48=80。

微信图片_20220908133933.png

3.现在新的数组内要放置 4 个元素，原来的数组排在第 3，所以需要将升级后的 3 移动到 64-95 位。

微信图片_20220908133948.png

4.继续将升级后的 2 移动到 32-63 位。

微信图片_20220908134003.png

5.继续将升级后的 1 移动到 0-31 位。

微信图片_20220908134019.png

6.然后会将 50000 放到 96-127 位。

微信图片_20220908134033.png

7.最后会修改 encoding 和 length 属性，修改之后就完成了本次的升级。

hashtable 编码

hashtable 结构在前面讲述哈希对象的时候进行过详细分析，想详细了解的可以点击这里。

intset 和 hashtable 编码转换

当一个集合满足以下两个条件时，Redis 会选择使用 intset 编码：

集合对象保存的所有元素都是整数值。
集合对象保存的元素数量小于等于 512 个（这个阈值可以通过配置文件 set-max-intset-entries 来控制）。

一旦集合中的元素不满足上面两个条件，则会选择使用 hashtable 编码。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序，支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址：https://gitee.com/zhijiantianya/yudao-cloud

视频教程：https://doc.iocoder.cn/video/

集合对象常用命令

sadd key member1 member2：将一个或多个元素 member 加入到集合 key 当中，并返回添加成功的数目，如果元素已存在则被忽略。
sismember key member：判断元素 member 是否存在集合 key 中。
srem key member1 member2：移除集合 key 中的元素，不存在的元素会被忽略。
smove source dest member：将元素 member 从集合 source 中移动到 dest 中，如果 member 不存在，则不执行任何操作。
smembers key：返回集合 key 中所有元素。

了解了操作集合对象的常用命令，我们就可以来验证下前面提到的哈希对象的类型和编码了，在测试之前为了防止其他 key 值的干扰，我们先执行 flushall 命令清空 Redis 数据库。

依次执行如下命令：

sadd num 1 2 3  //设置 3 个整数的集合，会使用 intset 编码
type num //查看类型
object encoding num   //查看编码
sadd name 1 2 3 test  //设置 3 个整数和 1 个字符串的集合，会使用 hashtable 编码
type name //查看类型
object encoding name //查看编码

得到如下效果：

微信图片_20220908134050.png

可以看到，当设置的元素里面只有整数时，集合使用的就是 intset 编码，当设置的元素中含有非整数时，使用的就是 hashtable 编码。

五种基本类型之有序集合对象

Redis 中的有序集合和集合的区别是有序集合中的每个元素都会关联一个 double 类型的分数，然后按照分数从小到大的顺序进行排列。换句话说，有序集合的顺序是由我们自己设值的时候通过分数来确定的。

有序集合对象的底层数据结构有两种：skiplist 和 ziplist。内部同样是通过编码来进行区分：

编码属性	描述	object encoding命令返回值
OBJ_ENCODING_SKIPLIST	使用跳跃表实现的有序集合对象	skiplist
OBJ_ENCODING_ZIPLIST	使用压缩列表实现的有序集合对象	ziplist

同一份数据，Redis为什么要存两次？(一）

前言