慢查询优化,终于在生产踩到了这个坑!!.md

本文涉及的产品
RDS AI 助手,专业版
RDS Agent(兼容OpenClaw),2核4GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 之前看了饿了么团队写的一篇博客:等等!这两个 Spring-RabbitMQ 的坑我们已经替你踩了。深受启发,一定要取个能吸引读者眼球的标题,当然除了响当当的标题以外,内容也要是干货。为什么会想取这样一个标题,因为看了理论上的慢查询优化,今天!!!终于在生产上实战了

之前看了饿了么团队写的一篇博客:等等!这两个 Spring-RabbitMQ 的坑我们已经替你踩了。深受启发,一定要取个能吸引读者眼球的标题,当然除了响当当的标题以外,内容也要是干货。为什么会想取这样一个标题,因为看了理论上的慢查询优化,今天!!!终于在生产上实战了


一、慢sql一

问题发现

将应用发布到生产环境后,前端页面请求后台API返回数据,发现至少需要6s。查看到慢sql:

image.png

复现慢sql

执行sql:

select count(*) from sync\_block\_datawhere unix\_timestamp(sync\_dt) >= 1539101010AND unix\_timestamp(sync\_dt) <= 1539705810

查看耗时:

image.png

一共耗时为2658ms 查看执行计划:

explain select count(*) from sync\_block\_datawhere unix\_timestamp(sync\_dt) >= 1539101010AND unix\_timestamp(sync\_dt) <= 1539705810

执行计划结果:

image.png

优化慢查询一

sync_dt的类型为datetime类型。换另外一种sql写法,直接通过比较日期而不是通过时间戳进行比较。将sql中的时间戳转化为日期,分别为2018-10-10 00:03:30和2018-10-17 00:03:30 执行sql:

select count(*) from sync\_block\_datawhere sync\_dt >= "2018-10-10 00:03:30"AND sync\_dt <= "2018-10-17 00:03:30"

查看耗时:


image.png


一共耗时419毫秒,和慢查询相比速度提升六倍多 查看执行计划:

explain select count(*) from sync\_block\_datawhere sync\_dt >= "2018-10-10 00:03:30"AND sync\_dt <= "2018-10-17 00:03:30"

执行计划结果:


image.png


访问页面,优化完成后请求时间平均为900毫秒


image.png


执行计划中慢查询和快查询唯一的区别就是type不一样:慢查询中type为index,快查询中type为range。整编:微信公众号,搜云库技术团队,ID:souyunku


优化慢查询二

这条sql的业务逻辑为统计出最近七天该表的数据量,可以去掉右边的小于等于 执行sql:

select count(*) from sync\_block\_datawhere sync_dt >= "2018-10-10 00:03:30"

查看耗时:

image.png


一共耗时275毫秒,又将查询时间减少了一半 查看执行计划:

explain select count(*) from sync\_block\_datawhere sync_dt >= "2018-10-10 00:03:30"

执行计划结果:


image.png


type仍是range。但是通过少比较一次将查询速度提高一倍


优化慢查询三

新建一个bigint类型字段syncdtlong存储syncdt的毫秒值,并在syncdt_long字段上建立索引 测试环境下:优化慢查询二sql

select count(*) from copy\_sync\_block\_datawhere sync\_dt >="2018-10-10 13:15:02"

耗时为34毫秒 优化慢查询三sql

select count(*) from copy\_sync\_block\_datawhere sync\_dt_long >= 1539148502916

耗时为22毫秒 测试环境中速度提升10毫秒左右


优化慢查询三sql测试小结:在InnoDB存储引擎下,比较bigint的效率高于datetime 完成三步优化以后生产环境中请求耗时:


image.png


速度又快了200毫秒左右。通过给查询的数据加10s缓存,响应速度最快平均为20ms


explain使用介绍

id: 执行编号,标识select所属的行。如果在语句中没子查询或关联查询,只有唯一的select,每行都将显示1。否则,内层的select语句一般会顺序编号,对应于其在原始语句中的位置


select_type: 显示本行是简单或复杂select。如果查询有任何复杂的子查询,则最外层标记为PRIMARY(DERIVED、UNION、UNION RESUlT)


table: 访问引用哪个表(引用某个查询,如“derived3”)


type: 数据访问/读取操作类型(ALL、index、range、ref、eq_ref、const/system、NULL)


possible_keys: 揭示哪一些索引可能有利于高效的查找


key: 显示mysql决定采用哪个索引来优化查询


key_len: 显示mysql在索引里使用的字节数


ref: 显示了之前的表在key列记录的索引中查找值所用的列或常量


rows: 为了找到所需的行而需要读取的行数,估算值,不精确。通过把所有rows列值相乘,可粗略估算整个查询会检查的行数。整编:微信公众号,搜云库技术团队,ID:souyunku


Extra: 额外信息,如using index、filesort等


重点关注type,type类型的不同竟然导致性能差六倍!!!


type显示的是访问类型,是较为重要的一个指标,结果值从好到坏依次是:system > const > eqref > ref > fulltext > refornull > indexmerge > uniquesubquery > indexsubquery > range > index > ALL ,一般来说,得保证查询至少达到range级别,最好能达到ref。


All: 最坏的情况,全表扫描


index: 和全表扫描一样。只是扫描表的时候按照索引次序进行而不是行。主要优点就是避免了排序, 但是开销仍然非常大。如在Extra列看到Using index,说明正在使用覆盖索引,只扫描索引的数据,它比按索引次序全表扫描的开销要小很多


range: 范围扫描,一个有限制的索引扫描。key 列显示使用了哪个索引。当使用=、 <>、>、>=、<、<=、IS NULL、<=>、BETWEEN 或者 IN 操作符,用常量比较关键字列时,可以使用 range |


ref: 一种索引访问,它返回所有匹配某个单个值的行。此类索引访问只有当使用非唯一性索引或唯一性索引非唯一性前缀时才会发生。这个类型跟eq_ref不同的是,它用在关联操作只使用了索引的最左前缀,或者索引不是UNIQUE和PRIMARY KEY。ref可以用于使用=或<=>操作符的带索引的列。


eq_ref: 最多只返回一条符合条件的记录。使用唯一性索引或主键查找时会发生 (高效)


const: 当确定最多只会有一行匹配的时候,MySQL优化器会在查询前读取它而且只读取一次,因此非常快。当主键放入where子句时,mysql把这个查询转为一个常量(高效)


system: 这是const连接类型的一种特例,表仅有一行满足条件。


Null: 意味说mysql能在优化阶段分解查询语句,在执行阶段甚至用不到访问表或索引(高效)


出现慢查询的原因

在where子句中使用了函数操作 出现慢查询的sql语句中使用了unix_timestamp函数统计出自'1970-01-01 00:00:00'的到当前时间的秒数差。导致索引全扫描统计出近七天的数据量的


解决方案

尽量避免在where子句中对字段进行函数操作,这将导致存储引擎放弃使用索引而进行全表扫描。对于需要计算的值最好通过程序计算好传入而不是在sql语句中做计算,比如这个sql中我们将当前的日期和七天前的日期计算好传入


后记

这个问题当时在测试环境没有发现,测试环境的请求速度还是可以的。没有被发现可以归结为数据量。生产数据量为百万级别,测试环境数据量为万级,数据量差50倍,数据量的增大把慢查询的问题也放大了。整编:微信公众号,搜云库技术团队,ID:souyunku


二、慢sql二

因为线上出现了很明显的请求响应慢的问题,又去看了项目中的其他sql,发现还有sql执行的效率比较低


复现慢sql

执行sql

select FROM\_UNIXTIME(copyright\_apply\_time/1000,'%Y-%m-%d') point,count(1) numsfrom resource\_info where copyright\_apply\_time >= 1539336488355 and copyright\_apply\_time <= 1539941288355 group by point

查看耗时:


image.png


耗时为1123毫秒 查看执行计划:

explain select FROM\_UNIXTIME(copyright\_apply\_time/1000,'%Y-%m-%d') point,count(1) numsfrom resource\_info where copyright\_apply\_time >= 1539336488355 and copyright\_apply\_time <= 1539941288355 group by point

执行计划结果:


image.png


索引是命中了,但是extra字段中出现了Using temporary和Using filesort


优化慢sql一

group by实质是先排序后分组,也就是分组之前必排序。通过分组的时候禁止排序优化sql 执行sql:

select FROM\_UNIXTIME(copyright\_apply\_time/1000,'%Y-%m-%d') point,count(1) numsfrom resource\_info where copyright\_apply\_time >= 1539336488355 and copyright\_apply\_time <= 1539941288355 group by point order by null

查看耗时:


image.png


一共耗时1068毫秒,提高100毫秒左右,效果并不是特别明显 查看执行计划:


image.png


extra字段已经没有Using filesort了,filesort表示通过对返回数据进行排序。所有不是通过索引直接返回排序结果的排序都是FileSort排序,说明优化后通过索引直接返回排序结果 Using temporary依然存在,出现Using temporary表示查询有使用临时表, 一般出现于排序, 分组和多表join的情况, 查询效率不高, 仍需要进行优化,这里出现临时表的原因是数据量过大使用了临时表进行分组运算。整编:微信公众号,搜云库技术团队,ID:souyunku


优化慢sql二

慢查询的sql业务逻辑为根据时间段分类统计出条件范围内各个时间段的数量 比如给定的条件范围为2018-10-20~2018-10-27的时间戳,这条sql就会统计出2018-10-20~2018-10-27每天的数据增量。现在优化成一天一天查,分别查七次数据,去掉分组操作

select FROM\_UNIXTIME(copyright\_apply\_time/1000,'%Y-%m-%d') point,count(1) numsfrom resource\_info where copyright\_apply\_time >= 1539855067355 and copyright\_apply\_time <= 1539941467355

查看耗时:


image.png


耗时为38毫秒,即使查7次所用时间也比1123毫秒少 查看执行计划:


image.png


extra字段中和慢查询的extra相比少了Using temporary和Using filesort。完美就这样第一次经历了真正的慢查询以及慢查询优化,终于理论和实践相结合了


相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
JSON 负载均衡 前端开发
一文带你详细了解Open API设计规范
一文带你详细了解Open API设计规范
9379 1
|
2月前
|
人工智能 Linux API
OpenClaw(Clawdbot)从部署到封神:五大Skill配置、阿里云/本地部署与大模型API对接全流程
2026年,OpenClaw(曾用名Clawdbot)已成为开源AI智能体框架的主流选择,凭借轻量化跨平台、多模型兼容、可视化交互等特性,广泛应用于个人助手、代码开发、文档处理、任务自动化等场景。很多用户部署后发现OpenClaw“不干活”,核心原因是**五大核心配置文件未正确设置**——SOUL.md、USER.md、HEARTBEAT.md、AGENTS.md、MEMORY.md是OpenClaw的“灵魂、交互、保活、能力、记忆”中枢,决定智能体能否稳定运行、高效执行任务。
1054 2
|
2月前
|
人工智能 Linux API
OpenClaw全自动小红书运营实战:从0到1全流程部署、技能配置与内容自动化发布指南
在内容自动化运营场景中,OpenClaw(Clawdbot)凭借高度可扩展的Skill体系与多任务执行能力,可实现从热点追踪、文案创作、封面生成到笔记发布、互动管理的全流程自动化。本文基于2026年最新环境,完整讲解如何通过阿里云轻量服务器或本地Windows11/macOS/Linux部署OpenClaw,安装并配置小红书运营Skill,完成Cookie登录、内容生成、笔记发布、数据监控,并接入阿里云百炼Coding Plan免费大模型与QMD记忆优化系统,实现低成本、7×24小时无人值守小红书运营。全文无营销词汇,所有命令可直接复制,零基础用户也能快速跑通全流程。
2648 9
|
2月前
|
人工智能 机器人 API
保姆级教程::OpenClaw多Agent协作系统搭建流程(阿里云/本地部署+百炼API配置+飞书绑定)
2026年,OpenClaw(昵称“龙虾”)的多智能体(Multi-Agent)功能成为进阶用户的核心需求。如果说单智能体是“全能专家”,多智能体就是“分工明确的团队”——每个智能体各司其职、协同工作,能高效处理软件开发、市场调研、内容创作等复杂多步骤任务,成为“一人公司”的核心生产力工具。通过本文的指南,你可快速搭建专属AI协作团队,让多个智能体按角色分工、协同工作,高效完成复杂任务,无论是市场调研、内容创作,还是软件开发、办公协同,都能大幅提升效率。
2828 8
|
2月前
|
缓存 API 网络安全
告别 Token 贵焦虑!保姆级教程;OpenClaw 阿里云+本地部署,付费/免费模型调教省 Token 成本指南
使用OpenClaw时,Token消耗过高是很多用户的核心痛点——收费模型效果好但成本高,免费模型成本低却能力有限。其实通过“收费模型调教+免费模型执行”的组合玩法,就能实现“Token自由”:先用收费模型打磨成熟任务流程并生成本地脚本,再切换到免费模型执行重复任务,既保证效果又节省成本,真正让免费Token玩出收费API的体验。
6193 1
|
2月前
|
SQL 人工智能 自然语言处理
别让RAG成为“人工智障”:用Agent Skills做知识库检索,究竟强在哪?
本文剖析传统RAG的三大痛点:检索失误即满盘皆输、长上下文导致信息淹没、静态流程无法适配动态问题;对比引入Anthropic Agent Skills框架的新范式——具备规划、路由与反思能力的“AI研究员”,支持多技能协同、可解释推理与自适应重试。实测显示其在复杂知识任务中相关性、深度与满意度显著提升。
|
2月前
|
人工智能 Linux API
OpenClaw+MiniMax M2.7集成流程:本地/阿里云端部署、大模型配置与复杂任务执行教程
MiniMax M2.7是2026年面向AI Agent场景深度优化的文本大模型,在指令遵循、长程任务、代码能力与多Skill协同上实现显著突破,成为适配OpenClaw(小龙虾)的高性价比国产模型选择。其核心优势集中在Agentic能力强化,可稳定支撑浏览器自动化、API调用、联网检索、办公文档处理、子Agent调度等复合任务,在复杂自动化场景中表现接近海外头部模型,成本仅为高端模型的零头,适合长期挂载OpenClaw执行稳定任务。
3147 2
|
2月前
|
人工智能 安全 API
阿里云/本地部署OpenClaw+Claude Code全栈实战:2种会话模式+4层架构与大模型配置指南
在AI开发辅助场景中,上下文丢失、会话不可持续、权限不可控、长期任务无法断点续跑,一直是影响效率的核心问题。OpenClaw与Claude Code的组合,通过ACP协议实现**编排层与执行层分离**,用持久化会话、线程绑定、四层架构、精细化权限控制,彻底解决AI临时记忆、不可长期运行的痛点。本文完整还原OpenClaw+Claude Code的架构设计、会话模式、权限体系与实战流程,同时补充2026年阿里云云端部署、MacOS/Linux/Windows11本地部署、阿里云千问大模型与免费Coding Plan API配置,搭配可直接复制的代码命令与高频问题解决方案,覆盖从零基础搭建到生产级
2231 0
|
2月前
|
数据采集 人工智能 机器人
从“会用”到“会改”:第一次打开OpenClaw配置文件,这些参数都是什么意思?
本文详解 OpenClaw 核心配置文件 `openclaw.json`(JSON5格式),逐层拆解 agents、models、channels、session 等关键模块,聚焦 temperature、模型切换、白名单、会话记忆等高频实用参数,并附热重载技巧、`doctor --fix` 救急命令与注释规范,助你从“能用”迈向“精通”。

热门文章

最新文章