InnoDB数据页什么时候合并(2)

简介: InnoDB数据页什么时候合并

3.1 除了表级可以设置外,单个索引也可以设置合并阈值

对InnoDB来说,其实整个表都是索引页,无非是聚集索引页还是辅助索引页而已。

因此,页合并阈值既可以用于聚集索引页,也可以用于辅助索引页。

只需要在创建索引时指定即可:

[root@yejr.run]> ALTER TABLE t_sk ADD INDEX k1(c1) COMMENT 'MERGE_THRESHOLD=20';


当然了,这个只能在创建索引时一次性指定,不能中途修改。

然而,表级别的合并阈值则可以在运行时修改:

[root@yejr.run]> ALTER TABLE t_sk COMMENT 'MERGE_THRESHOLD=40';

Query OK, 0 rows affected (0.01 sec)
Records: 0 Duplicates: 0 Warnings: 0

还可以通过查看元数据确认各个索引的合并阈值设置:

# 直接根据 TABLE_ID 条件查询聚集索引和辅助索引
# 如果辅助索引创建时没设置阈值,则其阈值设置直接从表级设置中继承
# 提醒:8.0中 INNODB_SYS_INDEXES 表名变成了 INNODB_INDEXES
[root@yejr.run]> SELECT FROM INFORMATION_SCHEMA.INNODB_SYS_INDEXES WHERE select from information_schema.innodb_sys_Indexes where TABLE_ID = 66\G
1. row **
INDEX_ID: 54
NAME: PRIMARY --聚集索引
TABLE_ID: 66
TYPE: 3
N_FIELDS: 1
PAGE_NO: 3
SPACE: 31
MERGE_THRESHOLD: 30
2. row **
INDEX_ID: 65
NAME: k1 --聚集索引
TABLE_ID: 66
TYPE: 0
N_FIELDS: 1
PAGE_NO: 8
SPACE: 31
MERGE_THRESHOLD: 20 --自行设定阈值为20%

# 或者执行SHOW语法
[root@yejr.run]> SHOW INDEX FROM t_sk\G
1. row **
Table: t_sk
Non_unique: 0
Key_name: PRIMARY
Seq_in_index: 1
Column_name: id
Collation: A
Cardinality: 494750
Sub_part: NULL
Packed: NULL
Null:
Index_type: BTREE
Comment:
Index_comment:
2. row **
Table: t_sk
Non_unique: 1
Key_name: k1
Seq_in_index: 1
Column_name: c1
Collation: A
Cardinality: 451839
Sub_part: NULL
Packed: NULL
Null:
Index_type: BTREE
Comment:
Index_comment: MERGE_THRESHOLD=20



3.2 页合并状态监控

页合并的统计情况,可以通过查询 INNODB_METRICS 表获取到。

# 先启用该metric
[root@yejr.run]> set global innodb_monitor_enable="module_index";
Query OK, 0 rows affected (0.00 sec)

# 一顿删除操作猛如虎出发页合并之后查询
[root@yejr.run]> SELECT NAME,COUNT,STATUS,COMMENT from INFORMATION_SCHEMA.INNODB_METRICS WHERE NAME LIKE 'index_page%merge%';
+-----------------------------+-------+---------+----------------------------------------+
| NAME | COUNT | STATUS | COMMENT |
+-----------------------------+-------+---------+----------------------------------------+
| index_page_merge_attempts | 13 | enabled | Number of index page merge attempts |
| index_page_merge_successful | 1 | enabled | Number of successful index page merges |
+-----------------------------+-------+---------+----------------------------------------+

通过监控这个metric,如果发现页合并非常频繁的话,可以考虑把 MERGE_THRESHOLD 阈值调低。但是设置太低也有风险,因为合并频率降低了,结果会导致更高的数据页碎片率。


3.3 如何适当调整阈值设置

有个不便的地方是,阈值 MERGE_THRESHOLD 无法全局设定(innodb_merge_threshold_set_all_debug参数只能用于debug版本,正常版本不可设置),而且通过 INNODB_METRICS 也无法监控到具体是哪些表上的合并操作最多。因此当发现有很高合并频率时,可能需要扫描所有表,找到那些碎片率较高的表,其产生合并的"嫌疑"应该也较高。

页分裂、合并是个平衡的艺术,如果表DDL设计的好,每条记录的长度基本上一致的话,并且没有频繁的变长更新或删除,那页合并的次数应该不会太高才对。


延伸阅读

Enjoy MySQL :)

最后多啰嗦一句,MySQL官方手册真是个宝藏,有事没事多翻翻吧。

全文完。

推荐搜索关键词列表:


            </div>
相关文章
|
7天前
|
数据采集 人工智能 安全
|
17天前
|
云安全 监控 安全
|
3天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
285 164
|
2天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
293 155
|
4天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:六十九、Bootstrap采样在大模型评估中的应用:从置信区间到模型稳定性
Bootstrap采样是一种通过有放回重抽样来评估模型性能的统计方法。它通过从原始数据集中随机抽取样本形成多个Bootstrap数据集,计算统计量(如均值、标准差)的分布,适用于小样本和非参数场景。该方法能估计标准误、构建置信区间,并量化模型不确定性,但对计算资源要求较高。Bootstrap特别适合评估大模型的泛化能力和稳定性,在集成学习、假设检验等领域也有广泛应用。与传统方法相比,Bootstrap不依赖分布假设,在非正态数据中表现更稳健。
224 113
|
10天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
770 5