mysql too many connections 分析

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: # 现象 实例出现too many connections ``` my 3093 Entry Port ==== 3093 ERROR 1040 (08004): Too many connections ``` gdb修改max_connections后查看processlist,

现象

实例出现too many connections

ERROR 1040 (08004): Too many connections

gdb修改max_connections后查看processlist, 有Waiting for backup lock,sql线程被阻塞,同时大量show slave status连接

| 131945 | system user |                     | mysql              | Connect          |  302156 | Waiting for Slave Worker to release partition                         | NULL                                                     |
| 131946 | system user |                     | NULL               | Connect          |  302832 | Waiting for an event from Coordinator                                 | NULL                                                     |
| 131947 | system user |                     | NULL               | Connect          |  381957 | Waiting for an event from Coordinator                                 | NULL                                                     |
| 131948 | system user |                     | NULL               | Connect          |  302167 | Waiting for an event from Coordinator                                 | NULL                                                     |
| 131949 | system user |                     | NULL               | Connect          |  302520 | Waiting for backup lock                                               | NULL                                                     |
| 131950 | system user |                     | NULL               | Connect          |  302531 | Waiting for backup lock                                               | NULL                                                     |
| 131951 | system user |                     | NULL               | Connect          |  302531 | Waiting for backup lock                                               | NULL                                                     |
| 131952 | system user |                     | NULL               | Connect          |  302537 | Waiting for backup lock                                               | NULL                                                     |
| 131953 | system user |                     | NULL               | Connect          |  302554 | Waiting for backup lock                                               | NULL                                                     |
| 187069 | root        | 127.0.0.1:49991     | NULL               | Sleep            |       9 |                                                                       | NULL                                                     |
| 211141 | root        | 127.0.0.1:49251     | NULL               | Query            |  297261 | init                                                                  | show slave status for channel ''                         |
| 245974 | root        | 127.0.0.1:48726     | NULL               | Query            |  297194 | init                                                                  | SHOW SLAVE STATUS                                        |
| 247341 | aurora      | 10.143.33.57:36949  | NULL               | Query            |  297336 | Killing slave                                                         | stop slave                                               |
| 247346 | root        | 127.0.0.1:58466     | NULL               | Killed           |  297335 | init                                                                  | show slave status                                        |
| 247349 | root        | 127.0.0.1:58565     | NULL               | Killed           |  297327 | init        

查看存在备份进程

root      86809  86803  0 May14 ?        00:00:00  innobackupex --defaults-file=/etc/my.cnf ......

分析

我们引入了percona 的Backup Locks方案,备份会执行LOCK TABLES FOR BACKUP

pt-pmt 分析线程堆栈信息,

show slave status等待LOCK_msr_map

__lll_lock_wait(libpthread.so.0),_L_lock_995(libpthread.so.0),pthread_mutex_lock(libpthread.so.0),inline_mysql_mutex_lock(mysql_thread.h:690),show_slave_status_cmd(mysql_thread.h:690),mysql_execute_command(sql_parse.cc:3347),mysql_parse(sql_parse.cc:7158),dispatch_command(sql_parse.cc:1597),do_handle_one_connection(sql_connect.cc:1006),handle_one_connection(sql_connect.cc:922),start_thread(libpthread.so.0),clone(libc.so.6)

stop slave持有LOCK_msr_map等待stop_cond io和sql退出

1 pthread_cond_timedwait,inline_mysql_cond_timedwait(mysql_thread.h:1199),terminate_slave_thread(mysql_thread.h:1199),terminate_slave_thread(rpl_slave.cc:1268),terminate_slave_threads(rpl_slave.cc:1268),terminate_slave_threads(rpl_slave.cc:9768),stop_slave(rpl_slave.cc:9768),stop_slave(rpl_slave.cc:611),stop_slave_cmd(rpl_slave.cc:756),mysql_execute_command(sql_parse.cc:3707),mysql_parse(sql_parse.cc:7158),dispatch_command(sql_parse.cc:1597),do_handle_one_connection(sql_connect.cc:1006),handle_one_connection(sql_connect.cc:922),start_thread(libpthread.so.0),clone(libc.so.6)

sql线程等待 worker线程执行完事务( slave_worker_hash_cond)

  1 pthread_cond_wait,inline_mysql_cond_wait(mysql_thread.h:1162),wait_for_workers_to_finish(mysql_thread.h:1162),slave_stop_workers(rpl_slave.cc:6471),handle_slave_sql(rpl_slave.cc:6997),start_thread(libpthread.so.0),clone(libc.so.6)

worker等待backup_tables_lock 锁

pthread_cond_timedwait,inline_mysql_cond_timedwait(mysql_thread.h:1199),MDL_wait::timed_wait(mysql_thread.h:1199),MDL_context::acquire_lock(mdl.cc:2416),Global_backup_lock::acquire_protection(lock.cc:1221),open_table(sql_base.cc:3173),open_and_process_table(sql_base.cc:4630),open_tables(sql_base.cc:4630),open_and_lock_tables(sql_base.cc:5735),open_and_lock_tables(sql_base.h:476),Rows_log_event::do_apply_event(sql_base.h:476),slave_worker_exec_job(rpl_rli_pdb.cc:2061),handle_slave_worker(rpl_slave.cc:5696),start_thread(libpthread.so.0),clone(libc.so.6)

而我们备份又持有backup_tables_lock锁

以锁等待依赖顺序导致大量的show slave status被阻塞,从而占满root连接

修复方法

可以通过kill备份的方式修复

如何避免

1 尽量不要使用myisam,减少备份持有LOCK TABLES FOR BACKUP的时间。本例中myisam有200多个

2 备份期间尽量不要执行stop slave操作。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
MySQL事务日志-Undo Log工作原理分析
|
19天前
|
SQL 关系型数据库 MySQL
MySQL 窗口函数详解:分析性查询的强大工具
MySQL 窗口函数从 8.0 版本开始支持,提供了一种灵活的方式处理 SQL 查询中的数据。无需分组即可对行集进行分析,常用于计算排名、累计和、移动平均值等。基本语法包括 `function_name([arguments]) OVER ([PARTITION BY columns] [ORDER BY columns] [frame_clause])`,常见函数有 `ROW_NUMBER()`, `RANK()`, `DENSE_RANK()`, `SUM()`, `AVG()` 等。窗口框架定义了计算聚合值时应包含的行。适用于复杂数据操作和分析报告。
60 11
|
3月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1746 14
MySQL事务日志-Redo Log工作原理分析
|
3月前
|
SQL 关系型数据库 MySQL
|
3月前
|
存储 关系型数据库 MySQL
基于案例分析 MySQL 权限认证中的具体优先原则
【10月更文挑战第26天】本文通过具体案例分析了MySQL权限认证中的优先原则,包括全局权限、数据库级别权限和表级别权限的设置与优先级。全局权限优先于数据库级别权限,后者又优先于表级别权限。在权限冲突时,更严格的权限将被优先执行,确保数据库的安全性与资源合理分配。
|
3月前
|
关系型数据库 MySQL 数据库连接
MySQL 1040 - Too many connections 如何解决?
【10月更文挑战第11天】MySQL 1040 - Too many connections 如何解决?
314 1
|
3月前
|
SQL 关系型数据库 MySQL
MySQL 更新1000万条数据和DDL执行时间分析
MySQL 更新1000万条数据和DDL执行时间分析
204 4
|
3月前
|
SQL 自然语言处理 关系型数据库
Vanna使用ollama分析本地MySQL数据库
这篇文章详细介绍了如何使用Vanna结合Ollama框架来分析本地MySQL数据库,实现自然语言查询功能,包括环境搭建和配置流程。
349 0
|
4月前
|
Oracle NoSQL 关系型数据库
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
主流数据库对比:MySQL、PostgreSQL、Oracle和Redis的优缺点分析
731 2
|
4月前
|
存储 关系型数据库 MySQL
分析MySQL主从复制中AUTO_INCREMENT值不一致的问题
通过对 `AUTO_INCREMENT`不一致问题的深入分析和合理应对措施的实施,可以有效地维护MySQL主从复制环境中数据的一致性和完整性,确保数据库系统的稳定性和可靠性。
135 6