[MySQL FAQ]系列 — 为什么InnoDB表要建议用自增列做主键

简介: [MySQL FAQ]系列 — 为什么InnoDB表要建议用自增列做主键

我们先了解下InnoDB引擎表的一些关键特征:

  • InnoDB引擎表是基于B+树的索引组织表(IOT);
  • 每个表都需要有一个聚集索引(clustered index);
  • 所有的行记录都存储在B+树的叶子节点(leaf pages of the tree);
  • 基于聚集索引的增、删、改、查的效率相对是最高的;
  • 如果我们定义了主键(PRIMARY KEY),那么InnoDB会选择其作为聚集索引;
  • 如果没有显式定义主键,则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引;
  • 如果也没有这样的唯一索引,则InnoDB会选择内置6字节长的ROWID作为隐含的聚集索引(ROWID随着行记录的写入而主键递增,这个ROWID不像ORACLE的ROWID那样可引用,是隐含的)。


综上总结,如果InnoDB表的数据写入顺序能和B+树索引的叶子节点顺序一致的话,这时候存取效率是最高的,也就是下面这几种情况的存取效率最高:

  • 使用自增列(INT/BIGINT类型)做主键,这时候写入顺序是自增的,和B+数叶子节点分裂顺序一致;
  • 该表不指定自增列做主键,同时也没有可以被选为主键的唯一索引(上面的条件),这时候InnoDB会选择内置的ROWID作为主键,写入顺序和ROWID增长顺序一致;
  • 除此以外,如果一个InnoDB表又没有显示主键,又有可以被选择为主键的唯一索引,但该唯一索引可能不是递增关系时(例如字符串、UUID、多字段联合唯一索引的情况),该表的存取效率就会比较差。



实际情况是如何呢?经过简单TPCC基准测试,修改为使用自增列作为主键与原始表结构分别进行TPCC测试,前者的TpmC结果比后者高9%倍,足见使用自增列做InnoDB表主键的明显好处,其他更多不同场景下使用自增列的性能提升可以自行对比测试下。


附图:

1、B+树典型结构

image.png

2、InnoDB主键逻辑结构

image.png


延伸阅读:

1、TPCC-MySQL使用手册, http://imysql.com/2012/08/04/tpcc-for-mysql-manual.html

2、B+Tree index structures in InnoDB, http://blog.jcole.us/2013/01/10/btree-index-structures-in-innodb/

3、B+Tree Indexes and InnoDB – Percona, http://www.percona.com/files/presentations/percona-live/london-2011/PLUK2011-b-tree-indexes-and-innodb.pdf

4、MySQL官方手册: Clustered and Secondary Indexes,

https://dev.mysql.com/doc/refman/5.6/en/innodb-index-types.html

            </div>
相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
12月前
|
数据采集 机器学习/深度学习 人工智能
《驯服“过拟合”之兽:守护人工智能算法的精准与稳健》
在人工智能发展中,过拟合是算法训练中常见问题,指模型过度学习训练数据中的细节和噪声,导致对新数据泛化能力差。为避免过拟合,需从数据质量和数量入手,确保数据多样性并适当增加数据量。同时,数据预处理(如归一化)、选择合适的模型复杂度、应用正则化技术(如L1/L2正则化)、采用早停法和交叉验证等方法,可有效提高模型的稳定性和准确性。防范过拟合至关重要,尤其在医疗、金融等领域,以确保算法的可靠性和实用性。
216 17
|
安全 数据挖掘 数据安全/隐私保护
国产CRM品牌巡礼:系统品牌的核心优势与特色
本文深度解析国产CRM系统的四大知名品牌:销售易、神州云动、销帮帮和天衣云。 销售易:中国领先的CRM解决方案提供商,提供全渠道获客、智能化销售流程及AIGC技术应用,赢得500强企业信赖。 神州云动:以PaaS+SaaS模式、灵活定制和行业解决方案著称,支持企业实现客户关系管理的数字化和智能化。 销帮帮:面向中小企业的实用型CRM系统,提供销售跟踪、客户视图等功能,提高销售效率和客户满意度。 天衣云:专注于云端部署,提供快速部署、高安全性的CRM解决方案,确保企业信息安全。 各品牌各有特色,企业应根据自身需求选择合适的CRM系统,以实现客户关系的全面管理,提升业务效率和客户满意度。
|
机器学习/深度学习
【题解】—— LeetCode一周小结49
LeetCode每日一道一周小结49
142 9
|
微服务
微服务实践之使用 Visual Studio 2022 调试Dapr 应用程序
微服务实践之使用 Visual Studio 2022 调试Dapr 应用程序
184 2
|
机器学习/深度学习 数据采集 数据挖掘
Python在数据科学中的应用:从数据处理到模型训练
Python在数据科学中的应用:从数据处理到模型训练
|
存储 人工智能 算法
NFT元宇宙链游系统开发技术规则逻辑及源码示例
NFT元宇宙链游系统开发涉及区块链、NFT、智能合约等核心技术。区块链确保去中心化和透明性,NFT用于确认数字资产所有权,智能合约管理数字资产的交易。源码示例展示了基于Solidity的NFT链游智能合约,包括NFT的铸造、收获和查询功能。
|
存储 关系型数据库 MySQL
mysql按天自动生成表分区的执行语句
mysql按天自动生成表分区的执行语句
449 0
|
网络协议 API C语言
什么是远程调用?图文简要介绍
什么是远程调用?图文简要介绍
511 0
|
消息中间件 存储 城市大脑
云原生事件驱动引擎(RocketMQ-EventBridge)应用场景与技术解析
RocketMQ 给人最大的印象一直是一个消息引擎。那什么是事件驱动引擎?为什么我们这次要推出事件驱动引擎这个产品?他有哪些应用场景,以及对应的技术方案是什么?本文我们就一起来看下。
1170 0
云原生事件驱动引擎(RocketMQ-EventBridge)应用场景与技术解析
|
算法 新能源 区块链
【纳什博弈、ADMM】基于纳什博弈和交替方向乘子法的多微网主体能源共享研究(Matlab代码实现)
【纳什博弈、ADMM】基于纳什博弈和交替方向乘子法的多微网主体能源共享研究(Matlab代码实现)
532 0