AliSQL · 特性介绍 · 支持 Invisible Indexes

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
简介: 前言MySQL 8.0 引入了 Invisible Indexes 这一个特性,对于 DBA 同学来说是一大福音,索引生命周期管理除了有和无外,又多了一种形态–可见和不可见,进而对业务SQL的调优又多了一种手段。关于 Invisible Indexes,不管是官方还是第三方,都有非常多的介绍文档,这里推荐大家可以先看下:官方文档: Invisible Indexes 官方 ser

前言

MySQL 8.0 引入了 Invisible Indexes 这一个特性,对于 DBA 同学来说是一大福音,索引生命周期管理除了有和无外,又多了一种形态–可见和不可见,进而对业务SQL的调优又多了一种手段。

关于 Invisible Indexes,不管是官方还是第三方,都有非常多的介绍文档,这里推荐大家可以先看下:

  1. 官方文档: Invisible Indexes
  2. 官方 server 层团队博客: MySQL 8.0: Invisible Indexes
  3. 官方 worklog: WL#8697: Support for INVISIBLE indexes
  4. Percona blog: Thoughts on MySQL 8.0 Invisible Indexes
  5. 我们的 weixiang 同学的文章:MySQL · 8.0新特性· Invisible Index

简单来说,Invisible Indexes 的特点是:对优化器来说是不可见的,但是引擎内部还是会维护这个索引,并且不可见属性的修改操只改了元数据,所以可以非常快。
当我们发现某个索引不需要,想要去掉的话,可以先把索引设置为不可见,观察下业务的反应,如果一切正常,就可以 drop 掉;如果业务有受影响,那么说明这个索引删掉会有问题,就可以快速改回来。所以相对于 DROP/ADD 索引这种比较重的操作,Invisible Indexes 就会显得非常灵活方便。

Invisible Indexes 是 server 层的特性,和引擎无关,因此所有引擎(InnoDB, TokuDB, MyISAM, etc.)都可以使用。

MySQL 官方只在 8.0 版本中支持了这一特性,考虑到 8.0 的普及还比较遥远,为了让大家能早日用上这么好的功能,我们将 Invisible Indexes 这一特性 backport 到 AliSQL 分支,目前开源分支已经支持,大家可以下载使用。

用法介绍

虽然官方文档里有详细的使用介绍,本文为了完整性,也简单介绍下使用方法。

  1. CREATE TABLE: 我们可以在建表时指定索引的不可见属性,默认是可见的。

     CREATE TABLE `t1` (
       `id` int(11) DEFAULT NULL,
       `tid` int(11) DEFAULT NULL,
       KEY `idx_tid` (`tid`) INVISIBLE
     ) ENGINE=InnoDB;
    
  2. ADD INDEX: 我们可以在后续加索引时,指定加的索引是否可见

     CREATE TABLE `t1` (
       `id` int(11) DEFAULT NULL,
       `tid` int(11) DEFAULT NULL
       ) ENGINE=InnoDB;
     CREATE INDEX idx_tid ON t1(tid) INVISIBLE;
     ALTER TABLE t1 ADD INDEX idx_tid(tid) INVISIBLE;
    
  3. ALTER INDEX: 我们可以在后续使用时,更改已有索引的可见性

     CREATE TABLE `t1` (
       `id` int(11) DEFAULT NULL,
       `tid` int(11) DEFAULT NULL,
       KEY `idx_tid` (`tid`) INVISIBLE
     ) ENGINE=InnoDB;
     ALTER TABLE t1 ALTER INDEX idx_tid VISIBLE;
    
  4. 展示信息增加:INFORMATION_SCHEMA.STATISTICS 内存表和 SHOW INDEX 结果里,分别多了一个 Visible/IS_VISIBLE 字段,表示索引是否可见:

     mysql> SHOW INDEX FROM t1\G
     *************************** 1. row ***************************
     Table: t1
     Non_unique: 1
     Key_name: idx_tid
     Seq_in_index: 1
     Column_name: tid
     Collation: A
     Cardinality: 0
     Sub_part: NULL
     Packed: NULL
     Null: YES
     Index_type: BTREE
     Comment:
     Index_comment:
     Visible: NO
    
     mysql> SELECT * FROM INFORMATION_SCHEMA.STATISTICS where table_name='t1' AND index_name='idx_tid'\G
     *************************** 1. row ***************************
     TABLE_CATALOG: def
     TABLE_SCHEMA: test
     TABLE_NAME: t1
     NON_UNIQUE: 1
     INDEX_SCHEMA: test
     INDEX_NAME: idx_tid
     SEQ_IN_INDEX: 1
     COLUMN_NAME: tid
     COLLATION: A
     CARDINALITY: 0
     SUB_PART: NULL
     PACKED: NULL
     NULLABLE: YES
     INDEX_TYPE: BTREE
     COMMENT:
     INDEX_COMMENT:
     IS_VISIBLE: NO
     1 row in set (0.00 sec)
    

下面我们用一例子来看下:

CREATE TABLE `t1` (
  `id` int(11) DEFAULT NULL,
  `tid` int(11) DEFAULT NULL,
  KEY `idx_tid` (`tid`) /*!50616 INVISIBLE */
) ENGINE=InnoDB DEFAULT CHARSET=latin1;
INSERT INTO t1 VALUES(1, 2), (3, 4), (5, 6), (7, 8), (9, 10);

可以看到下面的 EXPLAIN 结果,用的是全表扫描:

mysql> EXPLAIN SELECT * FROM t1 WHERE tid=4;
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows | Extra       |
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
|  1 | SIMPLE      | t1    | ALL  | NULL          | NULL | NULL    | NULL |    5 | Using where |
+----+-------------+-------+------+---------------+------+---------+------+------+-------------+
1 row in set (0.00 sec)

如果用 FORCE INDEX 强制指定的话,会报索引不存在的错(这个官方早期版本是不会报错的,最新新版本已经fix):

mysql> EXPLAIN SELECT * FROM t1 FORCE INDEX(idx_tid) WHERE tid=4;
ERROR 1176 (42000): Key 'idx_tid' doesn't exist in table 't1'

索引改为可见之后,优化器就可以用了:

mysql> ALTER TABLE t1 ALTER INDEX idx_tid VISIBLE;
mysql> EXPLAIN SELECT * FROM t1 WHERE tid=4;
+----+-------------+-------+------+---------------+---------+---------+-------+------+-------+
| id | select_type | table | type | possible_keys | key     | key_len | ref   | rows | Extra |
+----+-------------+-------+------+---------------+---------+---------+-------+------+-------+
|  1 | SIMPLE      | t1    | ref  | idx_tid       | idx_tid | 5       | const |    1 | NULL  |
+----+-------------+-------+------+---------------+---------+---------+-------+------+-------+
1 row in set (0.00 sec)

虽然索引对优化器不可见,但是 MySQL 内部还是会维护索引的,包括约束条件,可以看下面这个例子:

CREATE TABLE `t2` (
`id` int(11) NOT NULL DEFAULT '0',
`tid` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `idx_tid` (`tid`) INVISIBLE
) ENGINE=InnoDB;

mysql> INSERT INTO t2 VALUES (1, 2), (3, 4);
Query OK, 2 rows affected (0.00 sec)
Records: 2  Duplicates: 0  Warnings: 0

mysql> INSERT INTO t2 VALUES (5, 2);
ERROR 1062 (23000): Duplicate entry '2' for key 'idx_tid'

可以看到虽然 idx_tid 索引不可见,但是 UNIQUE 约束还是被遵守的。

使用注意和实现区别

使用注意:
1. PK 不能设置为不可见,这里的 PK 包括显示的PK,或者因为PK不存在,被提升为 PK 的 UK;
2. 虽然设置索引的不可见属性不需要重建表,但是改变了表定义(frm),需要重新打开表,因此会请求 MDL 排它锁,如果有大事务或者长SQL,会被 block,这点使用时需要注意;
3. INFORMATION_SCHEMA.STATISTICS 内存表和 SHOW INDEX 结果里多一个字段,如果有用到的话,需要做好兼容。

另外 AliSQL 支持索引使用统计(INFORMATION_SCHEMA.INDEX_STATISTICS),和 Invisible Indexes 配合使用效果更佳,比如我们可以根据索引使用找出使用频率低的索引,然后快速设置为不可见,如果业务没有影响的话,就可以进一步 DROP 掉索引。

实现上区别:
官方的 INVISIBLE INDEX 是实现在 8.0 里的,而在 8.0 其中一个重大改变,就是引入了 Data Dictionary,把原来在 Server 层放的元文件(.frm, .par, etc.)里的信息,全放在 InnoDB 里了。AliSQL 是 5.6 版本的,因此在元信息还是存储在 frm 文件里。这里有一个问题是,其中索引标志位占2个字节,目前16个 bit 已经全部被定义,如果扩展标志位的话,会造成不兼容,因为这里用了一个原先不会存在 frm 里flag HA_SORT_ALLOWS_SAME 来存储在 frm 表示索引不可见,这是为了保证兼容性,实现上比较 trick 的地方。

相关实践学习
自建数据库迁移到云数据库
本场景将引导您将网站的自建数据库平滑迁移至云数据库RDS。通过使用RDS,您可以获得稳定、可靠和安全的企业级数据库服务,可以更加专注于发展核心业务,无需过多担心数据库的管理和维护。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
机器学习/深度学习 监控 自动驾驶
视觉智能详解
视觉智能详解
1182 1
|
人工智能 运维 自然语言处理
智领,万象新生:智谱AI推动大模型商业化迈向新阶段
放眼当下的科技浪潮,AI大模型无疑是一年多来持续引人注目的焦点。基于大模型的算法推理,30秒即可生成完美可用的Word、PPT文档,工作时长不必再以小时计算;真人对话一般输入简短文字,就能在30秒内得到想要的图画、代码、文本、视频……大模型让科幻小说中的场景,走进了千行百业、千家万户的现实生活。
|
存储 搜索推荐 数据挖掘
数据库的应用
数据库在众多领域发挥着重要作用。在企业管理中,它助力客户关系、人力资源和财务管理,提升决策科学性和效率;金融领域中,银行系统、证券交易和保险行业依托数据库保障交易安全、投资决策及风险管理;医疗行业则通过电子病历管理和数据分析提高诊疗准确性并优化资源配置;电子商务运用数据库实现商品、订单管理和用户行为分析,增强购物体验;教育领域中,数据库支持学生信息、教学资源管理和教育数据分析,促进家校沟通与教学质量提升;科学研究方面,数据库促进数据共享、科研项目管理和深入数据分析,加速科学进步。
791 4
|
监控 Java Shell
JVMTI 在淘宝 Profiler 中的应用(上)
JVMTI 在淘宝 Profiler 中的应用()
531 5
|
存储 监控 Oracle
关系型数据库Oracle空间不足
【7月更文挑战第15天】
439 6
|
前端开发 安全 API
前端怎么样限制用户截图?
其实限制用户截图这个方案本身就不合理,除非整个设备都是定制的,在软件上阉割截图功能。为了这个需求添加更复杂的功能对于一些安全性没那么高的需求来说,有点本末倒置了。 下面聊聊正经方案: 1.对于后台系统敏感数据或者图片,主要是担心泄漏出去,可以采用斜45度七彩水印,想要完全去掉几乎不可能,就是观感比较差。 2.对于图片版权,可以使用现在主流的盲水印,之前看过腾讯云提供的服务,当然成本比较高,如果版权需求较大,使用起来效果比较好。 3.视频方案,tiktok下载下来的时候会有一个水印跑来跑去,当然这个是经过处理过的视频,非原画,画质损耗也比较高。Netflix等视频网站采用的是服务端权限控制,走的
|
JSON 安全 程序员
为什么POST请求会发送两次请求?
为什么POST请求会发送两次请求?
390 0
|
弹性计算 安全 云计算
传统物理服务器和阿里云云服务器的区别对比
随着云计算技术的持续演进与成熟,云服务器正在逐步成为企业运营与个人项目发展的基石。那么,相较于传统的物理服务器,云服务器究竟有哪些独特之处?到了2024年,这两者之间的区别又体现在哪些关键领域呢?首先,我们深入了解云服务器的核心特性。云服务器,作为云计算技术的产物,其实质是一种虚拟化的服务器。它拥有极高的灵活性和可扩展性。无论是内存、CPU、存储空间还是网络带宽,都可以根据实际需求进行动态调整。当业务高峰来临,云服务器能够迅速增加计算资源,确保服务的连续性与稳定性;而在业务需求降低时,又能够自动释放多余的资源,从而为用户节省成本。反观物理服务器,它作为一套独立的硬件设备,其配置往往是固定的
403 1
|
SQL 关系型数据库 MySQL
centos编译安装mariadb
一般我不太愿意用mysql,那个玩意,有的时候不太友好。 我还是比较喜欢mariadb。
690 0
|
数据采集 数据可视化 数据挖掘
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
【大数据实训】基于当当网图书信息的数据分析与可视化(八)
520 0