来了,公布答案!

简介: 思考题

大家好,我是小林。

昨天发了一篇关于索引失效的文章:谁还没碰过索引失效呢

我在文末留了一个有点意思的思考题:

123.png这个思考题其实是出自于,我之前这篇文章「一条 SQL 语句引发的思考」中留言区一位读者朋友出的问题。

很多读者都在留言区说了自己的想法,也有不少读者私聊我答案到底是什么?

所以,我今晚就跟大家聊聊这个思考题。


题目一


题目一很简单,相信大家都能分析出答案,我昨天分享的索引失效文章里也提及过。「题目 1 」的数据库表如下,id 是主键索引,name 是二级索引,其他字段都是非索引字段。

57.png

这四条模糊匹配的查询语句,第一条和第二条都会走索引扫描,而且都是选择扫描二级索引(index_name),我贴个第二条查询语句的执行计划结果图:

57.png而第三和第四条会发生索引失效,执行计划的结果 type= ALL,代表了全表扫描。56.png


题目二


题目 2 的数据库表特别之处在于,只有两个字段,一个是主键索引 id,另外一个是二级索引 name。

68.png

针对题目 2 的数据表,第一条和第二条模糊查询语句也是一样可以走索引扫描,第二条查询语句的执行计划如下,Extra 里的 Using index 说明用上了覆盖索引

87.png

我们来看一下第三条查询语句的执行计划(第四条也是一样的结果):

88.png

从执行计划的结果中,可以看到 key=index_name,也就是说用上了二级索引,而且从 Extra 里的 Using index 说明用上了覆盖索引。

这是为什么呢?

首先,这张表的字段没有「非索引」字段,所以 select * 相当于 select id,name,然后这个查询的数据都在二级索引的 B+ 树,因为二级索引的 B+ 树的叶子节点包含「索引值+主键值」,所以查二级索引的 B+ 树就能查到全部结果了,这个就是覆盖索引。

但是执行计划里的 type 是 index,这代表着是通过全扫描二级索引的 B+ 树的方式查询到数据的,也就是遍历了整颗索引树。

而第一和第二条查询语句的执行计划中 type 是 range,表示对索引列进行范围查询,也就是利用了索引树的有序性的特点,通过查询比较的方式,快速定位到了数据行。

所以,type=range 的查询效率会比 type=index 的高一些。

为什么选择全扫描二级索引树,而不扫描全表(聚簇索引)呢?

因为二级索引树的记录东西很少,就只有「索引列+主键值」,而聚簇索引记录的东西会更多,比如聚簇索引中的叶子节点则记录了主键值、事务 id、用于事务和 MVCC 的回流指针以及所有的剩余列。

再加上,这个 select * 不用执行回表操作。

所以, MySQL 优化器认为直接遍历二级索引树要比遍历聚簇索引树的成本要小的多,因此 MySQL 选择了「全扫描二级引树」的方式查询数据

为什么这个数据表加了非索引字段,执行同样的查询语句后,怎么变成走的是全表扫描呢?

加了其他字段后,select * from t_user where name like "%xx"; 要查询的数据就不能只在二级索引树里找了,得需要回表操作才能完成查询的工作,再加上是左模糊匹配,无法利用索引树的有序性来快速定位数据,所以得在二级索引树逐一遍历,获取主键值后,再到聚簇索引树检索到对应的数据行,这样实在太累了。

所以,优化器认为上面这样的查询过程的成本实在太高了,所以直接选择全表扫描的方式来查询数据。

从这个思考题我们知道了,使用左模糊匹配(like "%xx")并不一定会走全表扫描,关键还是看数据表中的字段。如果数据库表中的字段只有主键+二级索引,那么即使使用了左模糊匹配,也不会走全表扫描(type=all),而是走全扫描二级索引树(type=index)。

再说一个相似,我们都知道联合索引要遵循最左匹配才能走索引,但是如果数据库表中的字段都是索引的话,即使查询过程中,没有遵循最左匹配原则,也是走索引扫描的,而且 type 也是为 index,比如下图:

99.png

就说到这了,下次见啦


相关文章
|
8月前
|
运维 安全 测试技术
【答案】2023年国赛信息安全管理与评估正式赛答案-模块3 CTF
【答案】2023年国赛信息安全管理与评估正式赛答案-模块3 CTF
【答案】2023年国赛信息安全管理与评估正式赛答案-模块3 CTF
|
8月前
|
安全 Linux 网络安全
【答案】2023年国赛信息安全管理与评估正式赛答案-模块2
【答案】2023年国赛信息安全管理与评估正式赛答案-模块2
【答案】2023年国赛信息安全管理与评估正式赛答案-模块2
|
8月前
|
JavaScript 前端开发 API
谷歌google bard vs chatgpt给我的最大感受,速度真快,注册简单,多种答案提供。。。
谷歌google bard vs chatgpt给我的最大感受,速度真快,注册简单,多种答案提供。。。
58 0
|
云栖大会
为什么说不能错过这届云栖大会?我们先给出10个理由
为什么说不能错过这届云栖大会?我们先给出10个理由
|
机器学习/深度学习 人工智能 数据挖掘
参加Kaggle比赛的一般流程以及如何判断是否有条件参加
参加Kaggle比赛的一般流程以及如何判断是否有条件参加
737 1
参加Kaggle比赛的一般流程以及如何判断是否有条件参加
|
数据挖掘
2020年小美赛题目B题翻译(参考就行,我没参加比赛,纯属兴趣使然)
2020年小美赛题目B题翻译(参考就行,我没参加比赛,纯属兴趣使然)
185 0
2020年小美赛题目B题翻译(参考就行,我没参加比赛,纯属兴趣使然)
|
区块链
程序人生 - 祝贺登榜《区块链领域内容榜》NO.11
程序人生 - 祝贺登榜《区块链领域内容榜》NO.11
56 0
程序人生 - 祝贺登榜《区块链领域内容榜》NO.11
|
机器学习/深度学习 人工智能 算法
50万美元冠军成绩被莫名取消,Facebook热门数据竞赛引争议
Facebook AI 团队今天宣布了首个 Deepfake 检测挑战赛(DFDC)的结果,第一名算法的识别准确率达 82.56%。然而比结果更加耐人寻味的是,原本获得头名的团队成绩被取消了。
228 0
50万美元冠军成绩被莫名取消,Facebook热门数据竞赛引争议
|
设计模式 Web App开发 JavaScript
一份来自于全球的前端面试题清单,看看老外喜欢考哪些题(部分有答案)(二)
 方括号中的蓝色标题是题目的出处,有些题目在原址内包含答案。搜集的大部分外国前端面试题没有做翻译,单词并不难,大家应该看得懂。题目旁边的方括号内, 简单记录了与此题相关的知识点。总共大概一千多道,包含国内的题目,如有错误,欢迎指正。有些原链可能已无法打开,有些可能需要代理才能查看。
|
设计模式 移动开发 缓存
一份来自于全球的前端面试题清单,看看老外喜欢考哪些题(部分有答案)(一)
  方括号中的蓝色标题是题目的出处,有些题目在原址内包含答案。搜集的大部分外国前端面试题没有做翻译,单词并不难,大家应该看得懂。题目旁边的方括号内, 简单记录了与此题相关的知识点。总共大概一千多道,包含国内的题目,如有错误,欢迎指正。有些原链可能已无法打开,有些可能需要代理才能查看。