备案控制台

开发者社区云原生文章正文

一开工，就遇到上亿(MySQL)大表的优化，我的天啊！

2023-05-26 436

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： XX实例（一主一从）xxx告警中每天凌晨在报SLA报警，该报警的意思是存在一定的主从延迟（若在此时发生主从切换，需要长时间才可以完成切换，要追延迟来保证主从数据的一致性）

背景

XX实例（一主一从）xxx告警中每天凌晨在报SLA报警，该报警的意思是存在一定的主从延迟（若在此时发生主从切换，需要长时间才可以完成切换，要追延迟来保证主从数据的一致性）

XX实例的慢查询数量最多（执行时间超过1s的sql会被记录），XX应用那方每天晚上在做删除一个月前数据的任务

分析

使用pt-query-digest工具分析最近一周的mysql-slow.logpt-query-digest --since=148h mysql-slow.log | less结果第一部分

最近一个星期内，总共记录的慢查询执行花费时间为25403s，最大的慢sql执行时间为266s，平均每个慢sql执行时间5s，平均扫描的行数为1766万

结果第二部分

select arrival_record操作记录的慢查询数量最多有4万多次，平均响应时间为4s，delete arrival_record记录了6次，平均响应时间258s

select xxx_record语句

select arrival_record 慢查询语句都类似于如下所示，where语句中的参数字段是一样的，传入的参数值不一样select count(*) from arrival_record where product_id=26 and receive_time between '2019-03-25 14:00:00' and '2019-03-25 15:00:00' and receive_spend_ms>=0\G

select arrival_record 语句在mysql中最多扫描的行数为5600万、平均扫描的行数为172万，推断由于扫描的行数多导致的执行时间长

查看执行计划

用到了索引IXFK_arrival_record，但预计扫描的行数很多有3000多w行

现在已经知道了在慢查询中记录的select arrival_record where语句传入的参数字段有 product_id，receive_time，receive_spend_ms，还想知道对该表的访问有没有通过其它字段来过滤了？

神器tcpdump出场的时候到了

使用tcpdump抓包一段时间对该表的select语句

tcpdump -i bond0 -s 0 -l -w - dst port 3316 | strings | grep select | egrep -i 'arrival_record' >/tmp/select_arri.log

获取select 语句中from 后面的where条件语句

IFS_OLD=$IFS
IFS=$'\n'
for i in `cat /tmp/select_arri.log `;do echo ${i#*'from'}; done | less
IFS=$IFS_OLD

综上所示，优化方法为，删除复合索引IXFK_arrival_record，建立复合索引
idx_sequence_station_no_product_id，并建立单独索引indx_receive_time

delete xxx_record语句

该delete操作平均扫描行数为1.1亿行，平均执行时间是262s

delete语句如下所示，每次记录的慢查询传入的参数值不一样

delete from arrival_record where receive_time < STR_TO_DATE('2019-02-23', '%Y-%m-%d')\G

执行计划

测试

拷贝arrival_record表到测试实例上进行删除重新索引操作XX实例arrival_record表信息

磁盘占用空间48G，mysql中该表大小为31G，存在17G左右的碎片，大多由于删除操作造成的（记录被删除了，空间没有回收)

备份还原该表到新的实例中，删除原来的复合索引，重新添加索引进行测试

mydumper并行压缩备份

并行压缩备份所花时间（52s）和占用空间（1.2G，实际该表占用磁盘空间为48G，mydumper并行压缩备份压缩比相当高！）

Started dump at: 2019-03-26 12:46:04
........
Finished dump at: 2019-03-26 12:46:56
du -sh   /datas/dump_arrival_record/
1.2G    /datas/dump_arrival_record/

拷贝dump数据到测试节点scp -rp
/datas/dump_arrival_record root@10.230.124.19:/datas

多线程导入数据

time myloader -u root -S /datas/mysql/data/3308/mysqld.sock -P 3308 -p root -B test -d /datas/dump_arrival_record -t 32

real 126m42.885suser 1m4.543ssys 0m4.267s

逻辑导入该表后磁盘占用空间

du -h -d 1 /datas/mysql/data/3308/test/arrival_record.

12K
/datas/mysql/data/3308/test/arrival_record.frm

30G
/datas/mysql/data/3308/test/arrival_record.ibd没有碎片，和mysql的该表的大小一致*

cp -rp /datas/mysql/data/3308 /datas

分别使用online DDL和 pt-osc工具来做删除重建索引操作先删除外键，不删除外键，无法删除复合索引，外键列属于复合索引中第一列

做DDL 参考

实施

由于是一主一从实例，应用是连接的vip，删除重建索引采用online ddl来做。停止主从复制后，先在从实例上做（不记录binlog），主从切换，再在新切换的从实例上做（不记录binlog)

执行时间

再次查看delete 和select语句的执行计划

索引优化后

delete 还是花费了77s时间

delete from arrival_record where receive_time < STR_TO_DATE('2019-03-10', '%Y-%m-%d')\G

delete 语句通过receive_time的索引删除300多万的记录花费77s时间*

delete大表优化为小批量删除

应用端已优化成每次删除10分钟的数据（每次执行时间1s左右），xxx中没在出现SLA（主从延迟告警）

另一个方法是通过主键的顺序每次删除20000条记录

总结

表数据量太大时，除了关注访问该表的响应时间外，还要关注对该表的维护成本（如做DDL表更时间太长，delete历史数据）
对大表进行DDL操作时，要考虑表的实际情况（如对该表的并发表，是否有外键）来选择合适的DDL变更方式
对大数据量表进行delete，用小批量删除的方式，减少对主实例的压力和主从延迟

本文就是愿天堂没有BUG给大家分享的内容，大家有收获的话可以分享下，想学习更多的话可以到微信公众号里找我，我等你哦。

文章标签：

云数据库 RDS MySQL 版

SQL

关系型数据库

索引

MySQL

大数据

关键词：

云数据库 RDS MySQL 版优化

云数据库 RDS MySQL 版大表

云数据库 RDS MySQL 版大表优化

相关实践学习

每个IT人都想学的“Web应用上云经典架构”实战

本实验从Web应用上云这个最基本的、最普遍的需求出发，帮助IT从业者们通过“阿里云Web应用上云解决方案”，了解一个企业级Web应用上云的常见架构，了解如何构建一个高可用、可扩展的企业级应用架构。

MySQL数据库入门学习

本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品：云数据库RDS MySQL 版阿里云关系型数据库RDS（Relational Database Service）是一种稳定可靠、可弹性伸缩的在线数据库服务，提供容灾、备份、恢复、迁移等方面的全套解决方案，彻底解决数据库运维的烦恼。了解产品详情: https://www.aliyun.com/product/rds/mysql 

愿天堂没有BUG（公众号同名）

目录

相关文章

运营研究坊

|

6月前

|

SQL 缓存关系型数据库

MySQL 慢查询是怎样优化的

本文深入解析了MySQL查询速度变慢的原因及优化策略，涵盖查询缓存、执行流程、SQL优化、执行计划分析（如EXPLAIN）、查询状态查看等内容，帮助开发者快速定位并解决慢查询问题。

运营研究坊

271 0 0

蓝易云

|

4月前

|

缓存关系型数据库 MySQL

降低MySQL高CPU使用率的优化策略。

通过上述方法不断地迭代改进，在实际操作中需要根据具体场景做出相对合理判断。每一步改进都需谨慎评估其变动可能导致其他方面问题，在做任何变动前建议先在测试环境验证其效果后再部署到生产环境中去。

蓝易云

230 6 6

Unfailed_realme

|

5月前

|

存储 SQL 关系型数据库

MySQL 核心知识与索引优化全解析

本文系统梳理了 MySQL 的核心知识与索引优化策略。在基础概念部分，阐述了 char 与 varchar 在存储方式和性能上的差异，以及事务的 ACID 特性、并发事务问题及对应的隔离级别（MySQL 默认 REPEATABLE READ）。索引基础部分，详解了 InnoDB 默认的 B+tree 索引结构（多路平衡树、叶子节点存数据、双向链表支持区间查询），区分了聚簇索引（数据与索引共存，唯一）和二级索引（数据与索引分离，多个），解释了回表查询的概念及优化方法，并分析了 B+tree 作为索引结构的优势（树高低、效率稳、支持区间查询）。索引优化部分，列出了索引创建的六大原则

Unfailed_realme

148 2 2

青云@yd

|

5月前

|

存储 SQL 关系型数据库

MySQL 动态分区管理：自动化与优化实践

本文介绍了如何利用 MySQL 的存储过程与事件调度器实现动态分区管理，自动化应对数据增长，提升查询性能与数据管理效率，并详细解析了分区创建、冲突避免及实际应用中的关键注意事项。

青云@yd

231 0 0

技术自由圈/原疯狂创客圈

|

7月前

|

存储 SQL 关系型数据库

京东面试：mysql深度分页严重影响性能？根本原因是什么？如何优化？

京东面试：mysql深度分页严重影响性能？根本原因是什么？如何优化？

技术自由圈/原疯狂创客圈

528 8 8

京东面试：mysql深度分页严重影响性能？根本原因是什么？如何优化？

蓝易云

|

9月前

|

存储关系型数据库 MySQL

MySQL细节优化：关闭大小写敏感功能的方法。

通过这种方法，你就可以成功关闭 MySQL 的大小写敏感功能，让你的数据库操作更加便捷。

蓝易云

727 19 19

小虚竹

|

10月前

|

关系型数据库 MySQL 数据库

从MySQL优化到脑力健康：技术人与效率的双重提升

聊到效率这个事，大家应该都挺有感触的吧。不管是技术优化还是个人状态调整，怎么能更快、更省力地完成事情，都是我们每天要琢磨的事。

小虚竹

283 23 23

蓝易云

|

10月前

|

SQL 关系型数据库 MySQL

基于SQL Server / MySQL进行百万条数据过滤优化方案

对百万级别数据进行高效过滤查询，需要综合使用索引、查询优化、表分区、统计信息和视图等技术手段。通过合理的数据库设计和查询优化，可以显著提升查询性能，确保系统的高效稳定运行。

蓝易云

499 9 9

蓝易云

|

10月前

|

监控关系型数据库 MySQL

MySQL和SQLSugar百万条数据查询分页优化

在面对百万条数据的查询时，优化MySQL和SQLSugar的分页性能是非常重要的。通过合理使用索引、调整查询语句、使用缓存以及采用高效的分页策略，可以显著提高查询效率。本文介绍的技巧和方法，可以为开发人员在数据处理和查询优化中提供有效的指导，提升系统的性能和用户体验。掌握这些技巧后，您可以在处理海量数据时更加游刃有余。

蓝易云

921 9 10

SlackClimb

|

10月前

|

关系型数据库 MySQL

图解MySQL【日志】——磁盘 I/O 次数过高时优化的办法

当 MySQL 磁盘 I/O 次数过高时，可通过调整参数优化。控制刷盘时机以降低频率：组提交参数 `binlog_group_commit_sync_delay` 和 `binlog_group_commit_sync_no_delay_count` 调整等待时间和事务数量；`sync_binlog=N` 设置 write 和 fsync 频率，`innodb_flush_log_at_trx_commit=2` 使提交时只写入 Redo Log 文件，由 OS 择机持久化，但两者在 OS 崩溃时有丢失数据风险。

SlackClimb

266 3 3

云原生

热门文章

最新文章

Docker CE 镜像源站

Minikube - Kubernetes本地实验环境

微服务架构的理论基础 - 康威定律

微服务（Microservice）那点事

Docker的Windows容器初体验

3分钟，了解阿里云热门开发者工具 Cloud Toolkit

Docker学习路线图 (持续更新中)

利用Zipkin对Spring Cloud应用进行服务追踪分析

当 Kubernetes 遇到阿里云

基于Docker容器的，Jenkins、GitLab构建持续集成CI

从 Docker Run 到生产级部署：vLLM推理大模型服务的 Docker Compose 完整实战指南

基于springboot的web图书借阅规划管理系统

基于springboot的宠物服务管理系统

2026计算机毕业设计选题推荐，好做不麻烦

基于微信小程序的家政服务系统

探秘 AgentRun｜通过无代码创建的 Agent，如何用高代码进行更新？

活动回顾 | 阿里云AI原生应用开发实战营——AI Agent 专场（上海站）回顾&PPT下载

AgentRun Sandbox SDK 正式开源！集成 LangChain 等主流框架，一键开启智能体沙箱新体验

基于微信小程序的自习室座位预约系统

基于springboot的医院药品管理系统

相关课程

更多

云数据库MySQL版快速上手教程

阿里云云原生数据仓库AnalyticDB MySQL版使用教程

MySQL实战进阶

阿里云数据库产品家族及特性

数据库及SQL/MySQL基础

云数据库MySQL快速入门

相关电子书

更多

PolarDB MySQL引擎重磅功能及产品能力盛大发布

阿里云MySQL云数据库产品体系介绍

One Box：解读事务与分析一体化数据库 HybridDB for MySQL

推荐镜像

更多

mysql

下一篇

安全设备篇——WAF