数据库-阿里云开发者社区

数据库

2025-12-12 6

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本章介绍数据库核心知识，涵盖MySQL中char与varchar的区别、事务及其ACID特性，并解析并发事务引发的脏读、不可重复读与幻读问题及隔离级别解决方案。同时讲解索引结构，重点分析B+tree特点及其优势，区分聚簇索引与二级索引，为SQL优化提供理论基础。（238字）

第四章数据库
1、基本知识
1.1 MySQL数据库中的 char 与 varchar的区别是什么?
MySQL中的 char 和 varchar 都是用于存储字符串的数据类型，但它们在存储方式和性能上有所不同。以下是它们的主要区别：
第一点呢，就是存储方式不同：
●
char：定长字符串，长度是固定的，不管实际存储的字符串长度如何，都会占用固定长度的存储空间。如：char(10) 会始终占用10个字符的空间。
●
varchar：变长字符串，长度不固定。占用的空间与实际存储的字段长度有关。如：varchar(10) 表示最多可以存储10个字符，如果存储的字符串长度不足10，假设为5，只会占用5个字符空间。
第二点呢，就是性能不同：
●
对于char，由于其固定长度，操作会快些，但是会存储浪费磁盘空间的问题。
●
对于varchar，由于长度可变，操作时会相对慢一点，但是可以节省磁盘空间，尤其是存储的数据长度不固定时。
所以呢，我们在设计表结构的时候，需要根据具体的场景来选择具体的数据类型。就比如啊，如果是手机号、身份证号这样的字段，由于长度固定，我们就直接选择char类型即可，并指定长度，如：char(11)、char(18)。再比如，像用户名、备注信息这类长度不固定的，我们直接选择varchar类型，长度根据页面原型和需求文档确定。
1.2 什么是事务以及事务的四大特性？
●
必答内容：
事务是数据库中的基本概念，是指一组操作的集合，而这一组操作要么同时成功，要么同时失败，从而保证数据库中数据的正确性和完整性。
那事务呢，具有四大特性，也就是我们常说的ACID，分别是：原子性、一致性、隔离性、持久性。那接下来，我就分别来聊聊这四大特性。
1). 原子性指的是事务中的这一组操作，是不可分割的最小操作单元了，操作要么全部成功，要么全部失败。
2). 一致性是指在事务操作的前后，必须使数据处于一致的状态。
3). 隔离性指的是数据库中提供了隔离机制，保证事务在不受外部并发操作的影响的独立环境中运行。
4). 持久性就比较简单了，就是事务一旦提交或回滚了，它对数据库的改变就是永久的。
●
可能继续发问的问题：
1). 你刚才提到了并发事务，那并发事务回引发哪些问题?
并发事务引发的问题，主要有这么几个：
●
脏读：就是一个事务，读取到了另一个事务还没有提交的数据。
●
不可重复读：指的是在同一个事务中，先后读取同一条记录，但两次读取的数据不同。
●
幻读：指的是一个事务按照条件查询数据时，没有对应的行，但是插入时，又发现这行数据已经存在了好像出现了幻觉。
2). 如何解决这些问题呢?
那这些问题，在数据库系统中都已经解决了。在数据库中提供了不同的隔离级别来解决这些问题，分别有以下几种：
●
READ UNCOMMITED ：读未提交。这种隔离级别下，会出现脏读、不可重复读、幻读问题。
●
READ COMMITED：读已提交。这种隔离级别，解决了脏读问题，但是会出现不可重复读、幻读问题。
●
REPEATABLE READ：可重复读。这种隔离级别，解决了脏读、不可重复读问题，但是会出现幻读问题。
●
SERIALIZABLE：串行化。解决了上述所有的并发事务问题。
而在MySQL数据库中，默认的隔离级别是 REPEATABLE READ（可重复读）。
3). 那为什么没有用SERIALIZABLE(串行化) 这种隔离级别呢?
其实，隔离级别，也不是越高越好。因为隔离级别高了，确实可以解决并发事务引发的问题，但是隔离级别越高，性能也越低。
2、索引基础
2.1 MySQL数据库索引的数据结构？
●
必答内容：
在MySQL中的索引类型有多种哈，比如像B+tree索引、Hash索引等，但在InnoDB存储引擎中默认使用的是B+tree的索引。
●
可能继续追问的问题：
1). B+tree索引结构的特点是什么?
●
B+tree呢，也叫多路平衡搜索树，也就是一个节点中可以存储多个key，多个key，也就对应多个指针，大数据量的情况下，树的高度更低。（树的阶数更多，高度更低，检索更快）。
●
在B+tree中，所有的数据都是存放在叶子节点的，非叶子节点，仅仅起到索引数据的作用。
●
而在B+tree的叶子节点中，形成了一个双向链表，便于区间范围查询。
2). 那为什么MySQL数据库的索引结构要采用B+tree?
●
参考 2.4
2.2 知道什么是聚簇索引，什么是二级索引吗？
●
必答内容：
这个还是比较清楚的，因为这个是我们在项目中进行SQL语句优化的理论基础。
聚簇索引，有时候也称为聚集索引，他的特点呢就是数据与索引存放在一块儿，B+tree的叶子节点保存了整行数据，而且在一张表中，聚簇索引有且仅有一个，默认主键索引就是聚簇索引。
二级索引，有时候也称为非聚簇索引或辅助索引，指的是数据和索引分开存储，B+tree的叶子节点保存对应的主键，二级索引在一张表中可以有多个。
●
进阶内容（细节）：
那刚才提到，默认主键索引就是聚簇索引；虽然在项目开发中我们建议每一张表都必须要添加一个主键，但是从数据库本身来说，一张表是可以没有主键的，那如果没有主键，MySQL数据库会自动的选择第一个非空的唯一索引作为聚簇索引；而如果一张表既没有主键，又没有唯一索引，那这个时候MySQL数据库又会自动生成一个rowID作为聚簇索引。简单说，一张表必须有且仅有一个聚簇索引。
所以，从这个角度讲，在二级索引的叶子节点中存储的其实是对应的聚集索引的值（如果有主键，就是主键值；没有主键，有非空的唯一索引，那就是唯一索引的值；如果既没有主键，也没有非空的唯一索引，那就是自动生成的rowID的值）。

数据库

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据库

热门文章

最新文章

相关电子书