最佳实践—如何快速定位及解决数据库问题

简介: 本文介绍了数据库发生故障时的快速判断方法和解决办法。

如何定位系统瓶颈是否在数据库上

  • 通过Processlist来判断执行以下语句,显示PolarDB-X上所有正在执行的SQL语句。
SHOW PROCESSLIST WHERE INFO IS NOT NULL
  • 一般情况下,语句堆积会伴随着数据库卡慢一起出现,因此如果该语句的显示结果中没有大量执行时间大于0的语句,则基本可以断定问题不在数据库层面,反之,则说明数据库可能存在瓶颈。
  • 通过堆栈信息来判断应用与数据库之间通过TCP协议进行交互,如果数据库层出现瓶颈,则会产生应用将请求通过socket发送给了数据库,但是数据库不返回结果的情况,此时socket会阻塞在read方法上。因此我们可以通过应用当前的堆栈信息来判断是否在数据库层面发生了阻塞。本文以Java应用为例说明:
    1. 通过jstack命令dump堆栈信息。
    2. 在dump出的信息中搜索mysql驱动等待请求返回的堆栈,内容如下:
at java.net.SocketInputStream.socketRead0(Native Method)

at java.net.SocketInputStream.socketRead(SocketInputStream.java:116)
at java.net.SocketInputStream.read(SocketInputStream.java:171)
at java.net.SocketInputStream.read(SocketInputStream.java:141)
at com.mysql.jdbc.util.ReadAheadInputStream.fill(ReadAheadInputStream.java:101)
at com.mysql.jdbc.util.ReadAheadInputStream.readFromUnderlyingStreamIfNecessary(ReadAheadInputStream.java:144)
at com.mysql.jdbc.util.ReadAheadInputStream.read(ReadAheadInputStream.java:174)
- locked <0x00000002eb8f2d98> (a com.mysql.jdbc.util.ReadAheadInputStream)
at com.mysql.jdbc.MysqlIO.readFully(MysqlIO.java:3183)
at com.mysql.jdbc.MysqlIO.reuseAndReadPacket(MysqlIO.java:3659)
at com.mysql.jdbc.MysqlIO.reuseAndReadPacket(MysqlIO.java:3649)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4090)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:972)
at com.mysql.jdbc.MysqlIO.readAllResults(MysqlIO.java:2497)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2870)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2806)
  • 如果有大量的线程的堆栈情况如上例所示,则代表大量线程阻塞在等待数据库返回,说明瓶颈可能在数据库层面,反之,则应重点排查应用本身是否存在瓶颈。

数据库问题快速处置

在通过上述方法判断数据库存在瓶颈之后,推荐依次使用以下方法进行快速恢复。

方法一:KILL所有语句

如果Processlist中显示堆积了很多SQL,建议立即KILL掉所有正在执行的语句,PolarDB-X提供了如下指令进行这个操作:


KILL "ALL"

该语句会KILL掉计算节点与数据节点之间的每一个连接,从而达到结束掉所有语句的效果。

方法二:重启应用

执行方法一后,等待一段时间如果再次产生语句堆积,建议重启应用,避免应用因为处于某种错误的状态,不断的重试高代价的SQL。

方法三:SQL限流

方法2依然无法解决问题之后,建议使用PolarDB-X的CCL_RULES(限流功能)。

  1. 执行SHOW FULL PROCESSLIST命令,找到占比比较高的SQL的模板ID。
+----+---------------+-----------------+----------+-------------------------------+------+-------+-----------------------+-----------------+
| ID | USER | HOST | DB | COMMAND | TIME | STATE | INFO | SQL_TEMPLATE_ID |
+----+---------------+-----------------+----------+-------------------------------+------+-------+-----------------------+-----------------+
| 2 | polardbx_root | *...*:62787 | polardbx | Query | 0 | | show full processlist | NULL |
| 1 | polardbx_root | *...*:62775 | polardbx | Query(Waiting-selectrulereal) | 12 | | select 1 | 9037e5e2 |
+----+---------------+-----------------+----------+-------------------------------+------+-------+-----------------------+-----------------+
2 rows in set (0.08 sec)
  1. 通过模板ID对该类型的SQL进行限流,例如:
CREATE CCL_RULE IF NOT EXISTS `test` ON . TO 'ccltest'@'%'
FOR SELECT
FILTER BY TEMPLATE('9037e5e2')
WITH MAX_CONCURRENCY=10;

方法四:重启数据库

以上方法都无效的情况下,请重启数据库。

相关文章
|
SQL 数据可视化 关系型数据库
开源低代码平台推荐!10款优秀的开源低代码平台!
本文介绍了10款免费开源低代码开发平台,包括JeeLowCode、Ample、WaveMaker、JeecgBoot等,它们各自具备独特优势,如高性能架构、多数据库支持、实时开发部署等,适用于不同开发需求和应用场景,帮助企业高效实现数字化转型。
1776 3
|
11月前
|
存储 安全 网络安全
勒索病毒最新变种.wxr勒索病毒来袭,如何恢复受感染的数据?
在数字化时代,网络安全特别是勒索病毒的威胁日益严峻。.wxr勒索病毒以其快速传播、广泛感染和多途径扩散的特点,对全球用户构成严重威胁。本简介深入解析.wxr勒索病毒的特性与影响,涵盖其传染机制、防范措施及应对策略,并强调了数据备份与安全意识的重要性。针对被加密的数据文件,提供技术服务支持(sjhf91),帮助用户恢复数据,抵御网络威胁。同时提醒用户关注“91数据恢复”以获取更多最新信息和支持。 由于字符限制,以上内容已被精简以适应要求。
754 23
|
存储 5G API
来了,永久免费的图床服务
Markdown爱好者推荐PicGo软件搭配免费图床服务SMMS,解决在Markdown中插入图片的困扰。PicGo支持多种图床,如腾讯云、阿里云和免费的SMMS,提供拖拽上传、压缩图片功能。通过VSCode或Typora配合PicGo插件,能实现图片自动上传并转换为Markdown格式。SMMS提供5GB免费存储,足够个人博客使用。
|
数据采集 机器学习/深度学习 编解码
神马搜索如何提升搜索的时效性?
什么是搜索的时效性?有哪些特征?如何优化?本文分享神马搜索在搜索排序时效性问题上的实践和探索,从基础特征优化开始,通过标注数据进行排序和召回模型优化,以及时效性排序的召回体系和收录体系。较长,同学们可收藏后再看。
4329 0
神马搜索如何提升搜索的时效性?
|
存储 传感器 消息中间件
基于阿里云IoT组件搭建车联网基础平台
IoT在汽车行业企业中的应用多为车联网,车联网的搭建往往需要软件、硬件、通信等多方面的技术基础设施。阿里云IoT组件可以快速帮助企业解决相关平台搭建问题,帮助企业将精力更多的聚焦到业务本身的开发上去。
3653 2
基于阿里云IoT组件搭建车联网基础平台
|
人工智能 运维 监控
新发布:免费的防疫数据分析与可视化平台---阿里云新冠病毒疫情分析App
免费的防疫数据分析与可视化平台能力---阿里云新冠病毒疫情分析App 新冠病毒疫情分析App是基于阿里云日志服务中台,提供的一站式的数据处理可视化分析系统。借助它,可以在全球范围内了解各省份、市区的全面一手疫情信息和防疫新闻动态。目前该能力全面开放给政府、社区、第三方平台和开放者进行广泛应用。
4862 0
|
BI 开发者 新零售
免费下载!《0代码,搭应用》宜搭白皮书首发
宜搭是阿里巴巴自主研发的,人人都能使用的0代码应用搭建平台。任何一个没有编码能力的人,通过宜搭可视化拖拽的方式,都能轻松搭建出自己想要的应用。传统模式下需要13天完成的应用,用宜搭2小时便可完成。
10599 1
免费下载!《0代码,搭应用》宜搭白皮书首发
|
存储 弹性计算 网络协议
NAS支持IPv6访问的使用指南
阿里云文件存储(Network Attached Storage,简称 NAS) 提供VPC内的Ipv4和Ipv6的双栈访问,助力企业平滑升级到Ipv6架构。
9477 0
|
小程序 大数据 BI
新品ROI提升、直播转化提升……阿里云零售数据中台为品牌带来多重惊喜
阿里云零售数据中台助力天猫618消费季近百家零售企业业绩增长
1430 0
新品ROI提升、直播转化提升……阿里云零售数据中台为品牌带来多重惊喜
|
弹性计算 开发框架 自然语言处理
闲鱼研发框架应用和探索
Flutter是开源的UI工具包,其能够帮助开发者通过一套代码库高效构建多平台精美应用,支持移动、Web、桌面和嵌入式平台。在AliFlutter 系列第二场直播中,阿里巴巴闲鱼无线技术专家梁治峰为大家分享了闲鱼在Flutter中研发框架应用和探索,从分别从三个方向介绍Flutter一体化研发模式、Flutter动态化能力、Flutter互动能力。
2668 0
闲鱼研发框架应用和探索