【巡检问题分析与最佳实践】RDS MySQL 实例IO高问题

本文涉及的产品
RDS AI 助手,专业版
RDS Agent(兼容OpenClaw),2核4GB
PolarDB Agent Express,2核4GB
简介: RDS MySQL的IO性能受到硬件层存储介质类型、软件层的DB内核架构、具体SQL语句扫描或修改数据量的影响。

存储形态

RDS MySQL的存储形态主要有2种:

  • 本地存储:本地存储拥有最低的IO延迟,但是本地盘的存储大小有限,如果数据增量大,本地空间不够时,需要迁移数据到其他的主机,数据量大时迁移时间较长,且迁移会有闪断。
  • 分布式存储:也就是云盘,包括SSD和ESSD,云盘拥有更高的性价比,提供更大的存储空间,扩容非常快,不需要迁移数据。

关于更多存储相关的介绍,请参考:云数据库RDS简介 -> 存储类型 https://help.aliyun.com/document_detail/69795.html

InnoDB IO系统

InnoDB AIO实现了一套独立的IO系统来处理数据页的读取和写入,如果SQL请求的数据页不在buffer pool中,会产生物理IO,需要读写底层存储的数据。对于读数据页操作通过同步IO实现,同步IO调用底层的读接口,对于写数据页操作通过异步IO实现,比如后台线程刷脏,后台IO线程会异步的将脏页刷到存储。除了对普通数据文件的读写IO操作,写redo/undo日志、写binlog日志、临时表排序、DDL重建表空间也会产生大量的IO。

高IO负载常见问题

高吞吐的写入

比如表上有很多索引或大字段,频繁的更新、删除、插入场景,读取数据和刷脏会有大量的IO。您可以从自治服务->性能趋势查看IO负载相关的指标:

InnoDB Data读写吞吐量

1.png

每秒Innodb读取、删除、插入、更新的行数:

2.png

建议降低读写频率或升级实例规格、优化刷脏相关的参数来解决高IO问题。和刷脏相关的参数如下:

innodb_max_dirty_pages_pct

innodb_max_dirty_pages_pct_lwm

innodb_io_capacity

innodb_io_capacity_max

临时表产生大量IO

关注临时文件目录大小,如果临时目录很大,可能有慢SQL排序、去重产生很大的临时表,临时表写入也会造成IO增加。您可以从自治服务->性能趋势查看tmp或other目录大小:

3.png

读取冷数据造成的IO高

如果SQL查询或修改的数据不在buffer pool中,则需要从存储读取,如果读取的数据量非常大,可能会造成很大的读IO吞吐。缓存池命中率,如果命中率很低说明请求的数据不在buffer pool中,可能会产生大量的读IO请求。您可以从自治服务->性能趋势查看buffer pool命中率:

4.png

DDL语句产生的IO负担

DDL语句可能会rebuild表空间,扫描全表数据,创建索引排序,新表产生的脏页需要刷脏,这些都会导致大量的IO吞吐。另外一种场景是drop table大表造成的IO抖动,常见于删除上T的大表,可能会造成文件系统jbd2 进程D状态,可以采用AliSQL异步删除大文件的功能避免这个问题。如下图所示:

5.png

6.png

大事务写Binlog

事务只有在提交时才会写binlog文件,如果存在大事务,比如一条delete sql删除大量的行,可能会产生数十G的binlog文件,这个binlog的文件的落盘,会造成很高的IO吞吐。建议尽量将事务拆小,避免大事务和降低修改频率。如下图所示:

7.png

优化建议

您需要分析实例高IO负载是属于上面说的哪种类型,然后采取针对性的优化方法,比如调整刷脏参数,SQL优化(培训视频https://yq.aliyun.com/live/1938)、规格升级(参考https://help.aliyun.com/document_detail/96061.html)、采用AliSQL异步删除表空间(参考https://help.aliyun.com/document_detail/134095.html)的功能等。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
8月前
|
缓存 关系型数据库 BI
使用MYSQL Report分析数据库性能(下)
使用MYSQL Report分析数据库性能
536 158
|
7月前
|
存储 消息中间件 监控
MySQL 到 ClickHouse 明细分析链路改造:数据校验、补偿与延迟治理
蒋星熠Jaxonic,数据领域技术深耕者。擅长MySQL到ClickHouse链路改造,精通实时同步、数据校验与延迟治理,致力于构建高性能、高一致性的数据架构体系。
MySQL 到 ClickHouse 明细分析链路改造:数据校验、补偿与延迟治理
|
8月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(中)
使用MYSQL Report分析数据库性能
577 156
|
8月前
|
缓存 监控 关系型数据库
使用MYSQL Report分析数据库性能(上)
最终建议:当前系统是完美的读密集型负载模型,优化重点应放在减少行读取量和提高数据定位效率。通过索引优化、分区策略和内存缓存,预期可降低30%的CPU负载,同时保持100%的缓冲池命中率。建议每百万次查询后刷新统计信息以持续优化
685 161
|
7月前
|
NoSQL 算法 Redis
【Docker】(3)学习Docker中 镜像与容器数据卷、映射关系!手把手带你安装 MySql主从同步 和 Redis三主三从集群!并且进行主从切换与扩容操作,还有分析 哈希分区 等知识点!
Union文件系统(UnionFS)是一种**分层、轻量级并且高性能的文件系统**,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem) Union 文件系统是 Docker 镜像的基础。 镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
835 6
|
9月前
|
存储 关系型数据库 MySQL
深入理解MySQL索引类型及其应用场景分析。
通过以上介绍可以看出各类MySQL指标各自拥有明显利弊与最佳实践情墁,在实际业务处理过程中选择正确型号极其重要以确保系统运作流畅而稳健。
271 12
|
10月前
|
存储 SQL 关系型数据库
MySQL的Redo Log与Binlog机制对照分析
通过合理的配置和细致的管理,这两种日志机制相互配合,能够有效地提升MySQL数据库的可靠性和稳定性。
342 10
|
10月前
|
SQL 关系型数据库 MySQL
MySQL group by 底层原理详解。group by 执行 慢 原因深度分析。(图解+秒懂+史上最全)
MySQL group by 底层原理详解。group by 执行 慢 原因深度分析。(图解+秒懂+史上最全)
MySQL group by 底层原理详解。group by 执行 慢 原因深度分析。(图解+秒懂+史上最全)
|
SQL 关系型数据库 MySQL
【MySQL】SQL分析的几种方法
以上就是SQL分析的几种方法。需要注意的是,这些方法并不是孤立的,而是相互关联的。在实际的SQL分析中,我们通常需要结合使用这些方法,才能找出最佳的优化策略。同时,SQL分析也需要对数据库管理系统,数据,业务需求有深入的理解,这需要时间和经验的积累。
447 12
|
缓存 JSON 关系型数据库
MySQL 查询优化分析 - 常用分析方法
本文介绍了MySQL查询优化分析的常用方法EXPLAIN、Optimizer Trace、Profiling和常用监控指标。

相关产品

  • 云数据库 RDS MySQL 版
  • 云数据库 RDS
  • 推荐镜像

    更多