程序员晋级之路——mysql性能优化之数据库分区实战

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 程序员晋级之路——mysql性能优化之数据库分区实战

前言


笔者的上一个项目一切都在有条不紊的推进,直到通过了层层测试来到上线的那一天,实施小哥兴奋地挥舞着刚买到机票的手机,没想到真正的考验正在一步步逼近。

我们本次的项目是为了给我们的用户进行软件升级(因为种种历史原因,原软件代码已经无法维护),自带四百万账单数据,当数据入库完成的那一刻,大家全都安静了,账单结算根本跑不动!!!大量历史数据将查询更改操作无限拖慢,没有办法大家只能使用一些应急技巧,好歹让项目如期上线!

现在二期项目开始了,我们来一起探索这些项目优化点,首当其冲就是数据库!


分区or分表


最开始我们想要采用分表的方法来实现大数据量的问题,但是真正到实施的时候发现大家都没有分表的项目经验。我相信真正的分表项目一定有一套成熟完善的项目管理办法,可能比我们想象的要简单许多,无奈大家都没有大项目经验,只能退而求其次去了解一下分区。

经过了解之后我们发现这种历史数据的问题好像使用分区更加合理!


操作更加简单 ,项目该怎么管理就怎么管理,代码该怎么写还怎么写,不需要做一些很特殊的处理(其实当发现这一条有点的时候我们就决定了方案 ~ 。~);

热点数据相对集中,查询更加高效;

实施起来非常简单,一次实施永久拥有;

网上可以查到很多资料;

工作原理


分区是数据库将你需要存储的数据按照你选择的字段(这个字段是连贯的规律的,比如按时间正序排序的)将一张表中的数据存储到磁盘上的不同位置,形成一个个的数据区域,比如:2017年1月1日到2018年1月1日的所有账单数据存在一个区域内,2018年1月1日到2019年1月1日的所有数据存在一个区域内,当你的查询语句的条件中包含账单时间这个字段时,他会对每个区域开始的那条数据的账单时间和结束的那条数据的账单时间进行扫描,确定你所查询的数据在哪一个数据区域内,然后再去遍历这个这个数据区域,将符合条件的数据查询出来


具体实施


网上可以看到许多分区的资料,但是大多不够贴地气,看起来总是还要自己思考和实验(烦躁的一笔 ~ 。~),但是总结下来也就这么几个需要注意的点:

1.分区所选的字段必须是主键或者是混合主键的一部分,不然会报错:A PRIMARY KEY must include all columns in the table’s partitioning function

比如按时间进行分区操作,需要注意选择的时间要设置为第二主键,混合主键就就像下图这样:

image.png

在id和curtime一列的主键栏各点一下就 ok了!混合主键完成!!

那么为啥分区用的字段必须包含主键呢?

上文中我们提到数据库将一张表中的数据按照按照我们选择的字段将数据分割成一个个的数据区域,试想一下,如果id是我们的主键,我们是按照时间分区的,那么当我插入一条数据的时候数据库需要遍历所有的分区的所有的id去辨认我们新插入的id是否重复,这样无疑是低效的!~

2.分区需要的字段必须是int类型的,不然会报:Field ‘xxx’ is of a not allowed type for this type of partitioning。

在网上搜到的分区帖子,大部分都是使用时间去完成分区,可见使用时间分区是最合理的分区方案之一!

既然分区需要int类型那么date或者datetime类型的时间格式肯定需要处理一下子,这个地方可以使用TO_DAYS()方法将日期转换为从1970年1月1日到今天的天数,这个肯定是int类型无疑了。

接下来就是具体实施了:

1、首先在Navicat上建表,字段类型啥的自己定义就可以了

2、字段定义完成之后设置混合主键

3、右键你新建的表,如下

image.png

查看对象信息,点击ddl

image.png

查看表建立sql语句,在sql语句的最后加上

PARTITION BY RANGE (TO_DAYS(curtime) ) (
PARTITION p201712 VALUES LESS THAN (TO_DAYS('2018-01-01')),
PARTITION p201801 VALUES LESS THAN (TO_DAYS('2018-02-01'))
)

不要忘记将原来sql语句的;去掉!!!!

这样一个分区的数据库表就建立完成了。

手动新增mysql分区(注意只能在已有分区的表上新增):

ALTER TABLE record1 ADD PARTITION(
PARTITION p201902 VALUES LESS THAN (TO_DAYS('2019-03-01'))
);

查询是否建立分区成功:

select 
  partition_name part,  
  partition_expression expr,  
  partition_description descr,  
  table_rows  
from information_schema.partitions  where 
  table_schema = schema()  
  and table_name='record1';  --record1查询的表名
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
12天前
|
数据库 Windows
SqlServer数据恢复—SqlServer数据库所在分区损坏的数据恢复案例
一块硬盘上存放的SqlServer数据库,windows server操作系统+NTFS文件系统。由于误操作导致分区损坏,需要恢复硬盘里的SqlServer数据库数据。
|
2天前
|
缓存 关系型数据库 MySQL
【深入了解MySQL】优化查询性能与数据库设计的深度总结
本文详细介绍了MySQL查询优化和数据库设计技巧,涵盖基础优化、高级技巧及性能监控。
17 0
|
29天前
|
存储 Oracle 关系型数据库
数据库传奇:MySQL创世之父的两千金My、Maria
《数据库传奇:MySQL创世之父的两千金My、Maria》介绍了MySQL的发展历程及其分支MariaDB。MySQL由Michael Widenius等人于1994年创建,现归Oracle所有,广泛应用于阿里巴巴、腾讯等企业。2009年,Widenius因担心Oracle收购影响MySQL的开源性,创建了MariaDB,提供额外功能和改进。维基百科、Google等已逐步替换为MariaDB,以确保更好的性能和社区支持。掌握MariaDB作为备用方案,对未来发展至关重要。
59 3
|
29天前
|
安全 关系型数据库 MySQL
MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!
《MySQL崩溃保险箱:探秘Redo/Undo日志确保数据库安全无忧!》介绍了MySQL中的三种关键日志:二进制日志(Binary Log)、重做日志(Redo Log)和撤销日志(Undo Log)。这些日志确保了数据库的ACID特性,即原子性、一致性、隔离性和持久性。Redo Log记录数据页的物理修改,保证事务持久性;Undo Log记录事务的逆操作,支持回滚和多版本并发控制(MVCC)。文章还详细对比了InnoDB和MyISAM存储引擎在事务支持、锁定机制、并发性等方面的差异,强调了InnoDB在高并发和事务处理中的优势。通过这些机制,MySQL能够在事务执行、崩溃和恢复过程中保持
71 3
|
29天前
|
SQL 关系型数据库 MySQL
数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog
《数据库灾难应对:MySQL误删除数据的救赎之道,技巧get起来!之binlog》介绍了如何利用MySQL的二进制日志(Binlog)恢复误删除的数据。主要内容包括: 1. **启用二进制日志**:在`my.cnf`中配置`log-bin`并重启MySQL服务。 2. **查看二进制日志文件**:使用`SHOW VARIABLES LIKE 'log_%';`和`SHOW MASTER STATUS;`命令获取当前日志文件及位置。 3. **创建数据备份**:确保在恢复前已有备份,以防意外。 4. **导出二进制日志为SQL语句**:使用`mysqlbinlog`
88 2
|
1月前
|
SQL 关系型数据库 MySQL
数据库数据恢复—Mysql数据库表记录丢失的数据恢复方案
Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分数据。 2、客户端无法查询到完整的信息。
|
1月前
|
关系型数据库 MySQL 数据库
Python处理数据库:MySQL与SQLite详解 | python小知识
本文详细介绍了如何使用Python操作MySQL和SQLite数据库,包括安装必要的库、连接数据库、执行增删改查等基本操作,适合初学者快速上手。
266 15
|
1月前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
1月前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
2月前
|
关系型数据库 MySQL 数据库
GBase 数据库如何像MYSQL一样存放多行数据
GBase 数据库如何像MYSQL一样存放多行数据