InnoDB索引允许NULL对性能有影响吗(3)

2022-08-19 64

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： InnoDB索引允许NULL对性能有影响吗

2. 问题2：辅助索引需要MVCC多版本读的时候，为什么需要依赖聚集索引

InnoDB的MVCC是通过在聚集索引页中同时存储了DB_TRX_ID和DB_ROLL_PTR来实现的。

但是我们从上面page dump出来的结果也很明显能看到，附注索引页是不存储DB_TRX_ID信息的。

所以说，辅助索引上如果想要实现MVCC，需要通过回表读聚集索引来实现。

结论2，辅助索引中不存储DB_TRX_ID，需要依托聚集索引实现MVCC

3. 问题3：为什么查找数据时，一定要读取叶子节点，只读非叶子节点不行吗

在辅助索引的根节点这个页面中(pageno=4)，我们注意到它记录的最小记录(min_rec)对应的是(c1=NULL, id=9)这条记录。

在它指向的叶子节点页面中(pageno=18)也确认了这个情况。

现在把id=9的记录删掉，看看辅助索引数据页会发生什么变化。

[root@yejr.run]> delete from t_sk where id = 9 and c1 is null;
Query OK, 1 row affected (0.01 sec)

先检查第4号数据页。

[root@yejr.run]# innodb_space -s ibdata1 -T test/t_sk -p 4 page-dump

...
records:
{:format=>:compact,
:offset=>126,
:header=>
{:next=>428,
:type=>:node_pointer,
:heap_number=>2,
:n_owned=>0,
:min_rec=>true,
:deleted=>false,
:nulls=>["c1"],
:lengths=>{},
:externs=>[],
:length=>6},
:next=>428,
:type=>:secondary,
:key=>[{:name=>"c1", :type=>"INT UNSIGNED", :value=>:NULL}],
:row=>[{:name=>"id", :type=>"INT UNSIGNED", :value=>9}],
:sys=>[],
:child_page_number=>18,
:length=>8}
...

看到第四号数据页中，最小记录还是 id=9，没有更新。

再查看第18号数据页。

[root@yejr.run]# innodb_space -s ibdata1 -T test/t_sk -p 18 page-dump
...
records:
{:format=>:compact,
 :offset=>136,
 :header=>
  {:next=>146,
   :type=>:conventional,
   :heap_number=>3,
   :n_owned=>0,
   :min_rec=>false,
   :deleted=>false,
   :nulls=>["c1"],
   :lengths=>{},
   :externs=>[],
   :length=>6},
 :next=>146,
 :type=>:secondary,
 :key=>[{:name=>"c1", :type=>"INT UNSIGNED", :value=>:NULL}],
 :row=>[{:name=>"id", :type=>"INT UNSIGNED", :value=>30}],
 :sys=>[],
 :length=>4}
...

在这个数据页（叶子节点）中，最小记录已经被更新成 id=30 这条数据了。

可见，索引树中的非叶子节点数据不是实时更新的，只有叶子节点的数据才是最准确的。

结论3，在索引树中查找数据时，最终一定是要读取叶子节点才行

4. 问题4：索引列允许为NULL，会额外存储更多字节吗

之前流传有一种说法，不允许设置列值允许NULL，是因为会额外多存储一个字节，事实是这样吗？

我们先把c1列改成NOT NULL DEFAULT 0，当然了，改之前要先把所有NULL值更新成0。

[root@yejr.run]> update t_sk set c1=0 where c1 is null;
[root@yejr.run]> alter table t_sk modify c1 int unsigned not null default 0;

在修改之前，每条索引记录长度都是10字节，更新之后却变成了13个字节。

直接对比索引页中的数据，发现不同之处

#允许为NULL，且默认值为NULL时
{:format=>:compact,
 :offset=>136,
 :header=>
  {:next=>146,
   :type=>:conventional,
   :heap_number=>3,
   :n_owned=>0,
   :min_rec=>false,
   :deleted=>false,
   :nulls=>["c1"],
   :lengths=>{},
   :externs=>[],
   :length=>6},
 :next=>146,
 :type=>:secondary,
 :key=>[{:name=>"c1", :type=>"INT UNSIGNED", :value=>:NULL}],
 :row=>[{:name=>"id", :type=>"INT UNSIGNED", :value=>48}],
 :sys=>[],
 :length=>4}


#不允许为NULL，默认值为0时
{:format=>:compact,
 :offset=>138,
 :header=>
  {:next=>151,
   :type=>:conventional,
   :heap_number=>3,
   :n_owned=>0,
   :min_rec=>false,
   :deleted=>false,
   :nulls=>[],
   :lengths=>{},
   :externs=>[],
   :length=>5},
 :next=>151,
 :type=>:secondary,
 :key=>[{:name=>"c1", :type=>"INT UNSIGNED", :value=>0}],
 :row=>[{:name=>"id", :type=>"INT UNSIGNED", :value=>48}],
 :sys=>[],
 :length=>8}

可以看到，原先允许为NULL时，record header需要多一个字节（共6字节），但实际物理存储中无需存储NULL值。

而当设置为NOT NULL DEFAULT 0时，record header只需要5字节，但实际物理存储却多了4字节，总共多了3字节，所以索引记录以前是10字节，更新后变成了13字节，实际上代价反倒变大了。

列值允许为NULL更多的是计算代价变大了，以及索引对索引效率的影响，反倒可以说是节省了物理存储开销。

结论4，定义列值允许为NULL并不会增加物理存储代价，但对索引效率的影响要另外考虑

最后，本文使用的MySQL版本Percona-Server-5.7.22，下载源码后自编译的。

Server version:        5.7.22-22-log Source distribution

5. 几点总结

最后针对InnoDB辅助索引，总结几条建议吧。

a) 索引列最好不要设置允许NULL。

b) 如果是非索引列，设置允许为NULL基本上无所谓。

c) 辅助索引需要依托聚集索引实现MVCC。

d) 叶子节点总是存储最新数据，而非叶子节点则不一定。

e) 尽可能不SELECT *，尽量利用覆盖索引完成查询，能不回表就不回表。

6. 延伸阅读

InnoDB表聚集索引层高什么时候发生变化
浅析InnoDB索引结构
Innodb页合并和页分裂
innblock | InnoDB page观察利器
jcole.us：The physical structure of InnoDB index pages
jcole.us：B+Tree index structures in InnoDB

Enjoy MySQL :)

全文完。

            </div>

InnoDB索引允许NULL对性能有影响吗(3)

2. 问题2：辅助索引需要MVCC多版本读的时候，为什么需要依赖聚集索引

结论2，辅助索引中不存储DB_TRX_ID，需要依托聚集索引实现MVCC

3. 问题3：为什么查找数据时，一定要读取叶子节点，只读非叶子节点不行吗

结论3，在索引树中查找数据时，最终一定是要读取叶子节点才行

4. 问题4：索引列允许为NULL，会额外存储更多字节吗

结论4，定义列值允许为NULL并不会增加物理存储代价，但对索引效率的影响要另外考虑

5. 几点总结

6. 延伸阅读

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

InnoDB索引允许NULL对性能有影响吗(3)

2. 问题2：辅助索引需要MVCC多版本读的时候，为什么需要依赖聚集索引

结论2，辅助索引中不存储DB_TRX_ID，需要依托聚集索引实现MVCC

3. 问题3：为什么查找数据时，一定要读取叶子节点，只读非叶子节点不行吗

结论3，在索引树中查找数据时，最终一定是要读取叶子节点才行

4. 问题4：索引列允许为NULL，会额外存储更多字节吗

结论4，定义列值允许为NULL并不会增加物理存储代价，但对索引效率的影响要另外考虑

5. 几点总结

6. 延伸阅读

热门文章

最新文章

相关电子书