redis和缓存及相关问题和解决办法 什么是缓存预热、缓存穿透、缓存雪崩、缓存击穿

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
简介: 本文深入探讨了Redis缓存的相关知识,包括缓存的概念、使用场景、可能出现的问题(缓存预热、缓存穿透、缓存雪崩、缓存击穿)及其解决方案。

1、Redis最主要的用途

有三个方面:

  • 存储数据(内存数据库)
  • 缓存(redis最常用的场景)
  • 消息队列

而redis和缓存间存在什么关系呢?redis在发挥作用时会遇到哪些问题?

2、什么是缓存?

缓存是一种临时存储数据的技术,用于在后续请求中快速获取先前检索或计算的数据,从而加速访问速度。

在计算机系统中,缓存可以出现在多个层次,包括硬件缓存、操作系统缓存和应用程序级别的缓存。这种机制的基本思想是通过存储一些计算结果或频繁访问的数据,减少对更慢的存储系统(如数据库或磁盘)的访问次数,从而提高系统的性能和响应速度

其实缓存是相对的概念

  • 比如拿读取速度排序: CPU寄存器 > 内存 > 硬盘 > 网络
  • 速度快的设备,可以作为速度慢的设备的缓存
  • 最常见的是,使用内存作为硬盘的缓存(redis定位)
  • 硬盘也可以作为网络的缓存

2.1、此处介绍一下浏览器的缓存

浏览器缓存是指浏览器在本地存储已访问过的网页资源,以便在后续访问相同页面时能够更快地加载内容。浏览器缓存有助于提高网页加载速度、减轻服务器负担,并提升用户体验

浏览器通过http/https等从服务器上获取到数据(html,css,js,图片,视频,音频,字体...)并进行展示

优点举例:

    像图片这样的体积大,又不太改变的数据,就可以保存到浏览器本地(浏览器所在主机的硬盘上),后续再打开这个页面,就不必重新从网络获取上述数据了

缺点举例:

    如果前端代码有所修改,或者图片等内容有所改变,用户看到的可能仍然是原来的网页,这就是因为浏览器的缓存,它有些数据默认还是用的缓存中的数据,没有及时更新,导致残留的是旧版本的前端代码,引发bug(可以按ctrl+F5来强制刷新浏览器缓存)

缓存速度虽然快,但是空间小

通常使用redis作为mysql等数据库的缓存,因为mysql相比redis来说慢很多

3、为什么mysql等数据库慢呢?

此处拿类似mysql的这种关系型数据库举例

3.1、为什么说关系型数据库性能不高?

  • 数据库把数据存储在硬盘中,硬盘的IO速度并不快,尤其是随机访问(硬件)
  • 如果查询不能命中索引,就需要进行表的遍历,这就会大大增加硬盘IO次数(硬件)
  • 关系型数据库对于SQL的执行会做一系列的解析,校验,优化工作(软件)
  • 如果是一些复杂查询,比如联合查询,需要进行笛卡尔积操作,效率更是降低很多(软件)
  • ......

3.2、为什么要引入redis,而不是全部的查询操作都经过mysql呢?

  • 因为mysql等数据库,效率比较低,所以承担的并发量就有限,一旦请求数量多了,数据库的压力就会很大,甚至很容易就泵机了
  • 服务器每次处理一个请求,一定都要消耗一些硬件资源(cpu,内存,硬盘,网络...)
  • 任意一种资源的消耗超出了机器能提供的上限,机器就很容易出现故障了

4、如何提高mysql能承担的并发量?

四个大字: 开源 节流

  • 开源:引入更多的机器,构成数据库集群
  • 节流:引入缓存,就是典型的方案,把一些频繁读取的热点数据,保存到缓存上 后续在查询数据的时候,如果缓存中已经存在了,就不再访问mysql了

客户端发送的查询数据等请求,会先到达redis,如果redis没有,再查mysql

虽然redis上只能存少数数据,但是大部分请求都是使用的这少数的热点数据(二八原则)

5、如何知道哪些数据是热点数据呢?

  • 客户端发送的查询数据等请求,会先到达redis,如果redis没有,再查mysql
  • 虽然redis上只能存少数数据,但是大部分请求都是使用的这少数的热点数据(二八原则)

这是依靠缓存的更新策略来进行实现的

  • 定期生成
  • 定时生成

5.1、定期生成

会把访问的数据,以日志的形式记录下来,然后针对某个时间段或时间点访问高频的数据存储到redis里

举例:

  • 通过日志,把都使用了哪些词,给记录下来
  • 然后就可以针对这些日志进行统计了
  • 统计这一天,每个词出现的频率,再根据频率降序排序
  • 再取出前20%的词
  • 就可以把这些词认为是“热点词”
  • 接下来就可以把这些热点词,涉及到的搜索结果提前拎出来
  • 就可以放到类似于“redis”这样的缓存中了
  • 以上这些步骤可以用下面操作来实现(只是举例,实际肯定更麻烦):
  • 写一套离线的流程(往往使用shell,python写脚本代码...)

可以通过定时任务来触发:

  • 完成统计热词的过程
  • 根据热词,找到搜索结果的数据(广告数据)
  • 把得到的缓存数据同步到缓存服务器上
  • 控制这些缓存服务器自动重启

  • 优点:实际上实现起来可能比较简单,过程更可控(缓存中有啥是比较固定的),方便排查问题

  • 缺点:实时性不够,如果出现一些突发性事件,有一些本来不是热词的内容,成了热词了,新的热词就可能给后面的数据库啥的带来较大的压力

缺点举例:

    比如春节晚会,一般就是过年这几天,但是访问量可能会达到一年中最高的数量,但是过完年后几乎没人再去搜索,它就不适合继续当热词了,但如果按照定时生成策略的话,它会一直是热词

5.2、实时生成

  • 查询数据时:
  • 如果在redis查到了,就直接返回
  • 如果 redis 中不存在,就从数据库查,把查到的结果同时也写入Redis
  • 经过一段时间的“动态平衡”,redis中的key就逐渐都成为热点数据了

缺点:这样不停地写redis,就会使redis的内存占用越来越多,逐渐达到内存上限(不一定是机器内存上限,redis中也可以配置,最多使用多少内存)

为了解决上述情况,redis就引入了”内存淘汰策略“

5、通用的内存淘汰策略

为了解决生成热点数据方法带来的缺点,redis就引入了”内存淘汰策略“

主要有以下几种,下列策略并非局限于Redis,其他缓存也可以按这些策略展开

这其中的淘汰策略,Random太随机了,不太合理,而LFU是按照次数来衡量的,是最靠谱的

6、redis中内置的淘汰策略

  • lru补充:这句话描述的设置了过期时间的key,是指设置了过期时间的就算,包括过期时间还没到的
  • noeviction补充: 这是默认选项,不适合于实时更新缓存

redis里面,有一个配置项,就可以设置redis采取上述那种策略淘汰内存数据

具体采取哪种策略,结合实际场景来具体问题具体分析

相对来说,实时生成是没有定期生成更可控的,更多情况下还是使用定期生成

7、缓存使用注意事项,缓存可能出现的四大问题(专业术语)

  • 缓存预热
  • 缓存穿透
  • 缓存雪崩
  • 缓存击穿

8、缓存预热

避免服务器刚启动或者大批key失效时没有数据,导致所有的请求都打给mysql,把mysql搞挂了

缓存中的数据是定期生成和定时生成两种实现方式(其余方式也有,此处以这两种举例)

  • 定期生成,这种情况,不涉及”预热“
  • 定时生成就涉及预热

redis服务器首次接入之后,服务器里是没有数据的

此时,所有的请求都会打给mysql,从而造成数据库较大的压力

当然,随着时间推移,redis上的数据越积累越多,mysql承担的压力就逐渐减小了

缓存预热,就是用来解决上述问题的

  • 它把定期生成和实时生成结合一下
  • 先通过离线的方式,通过一些统计的途径,先把热点数据找到一批,导入到redis中
  • 此时导入的这批热点数据,就能帮mysql承担很大的压力了
  • 随着时间的推移,逐渐使用新的热点数据淘汰掉旧的数据

9、 缓存穿透

访问的key在redis和数据库中都不存在,这个key肯定也没有被更新到redis中

这次查询没有,下次查询,仍然没有,如果像这样的数据,存在很多,并且还反复查询,一样也会给mysql带来很大的压力

为何产生?

原因可能有以下几种:

  • 业务设计不合理,比如缺少必要的参数校验环节,导致非法的key也被进行查询了
  • 开发/运维误操作,不小心把部分数据从数据库中误删了
  • 黑客恶意攻击

如何解决?

通过改进业务/加强监控报警 => 有用,但属于亡羊补牢

更靠谱的方案(降低问题的严重性)

  • 如果发现这个key,在redis和mysql上都不存在,仍然写入redis中,value设成一个非法值(比如"")
  • 还可以引入布隆过滤器,每次查询redis/mysql之前都先判定一下key是否在 布隆过滤器中 存在

(把所有的key都插入到布隆过滤器中)

布隆过滤器,本质上是结合了 hash + bitmap

以比较小的空间开销,比较快的时间速度,实现针对key是否存在的判定

10、 缓存雪崩

由于在短时间内,redis上大规模的key失效,导致缓存命中率陡然下降,并且mysql的压力迅速上升,甚至直接泵机

为何产生?

原因可能有以下几种:

  1. redis直接挂了 = > redis泵机/redis集群模式下大量节点泵机
  2. redis好着呢,但是可能之前短时间内设置了很多key给redis,并且设置的过期时间是相同的

补:为什么设置过期时间?

给redis里设置key作为缓存的时候,有的时候为了考虑缓存的时效性,就会设置过期时间(和redis内存淘汰机制,是配合使用的)

如何解决?

  • 加强监控报警,加强redis集群可用性的保证
  • 不给key设置过期时间/设置过期时间的时候添加随机的因子(避免同一时刻过期)

11、缓存击穿(缓存瘫痪)

缓存击穿(翻译的不太合适),也可以称之为缓存瘫痪(合适)

相当于缓存雪崩的特殊情况,针对热点key,突然过期了,导致大量的请求直接访问到数据库上,甚至引起数据库泵机

如何解决?

  • 基于统计的方式发现热点key,并设置永不过期
  • 进行必要的服务降级,例如访问数据库的时候使用分布式锁,限制同时请求数据库的并发数量

补:

1、解决方案1往往需要服务器结构做出较大的调整

2、解决方案2中的服务降级指的是可能本身服务器的功能有十个,但是在特定情况下,适当的关闭一些不重要的功能,只保留核心功能

   功能/服务降级也可以称之为省电模式

   访问数据库的时候使用分布式锁  = >  通过分布式锁,限制数据库的访问频率

🧸欢迎您于百忙之中阅读这篇博客,📜希望这篇博客给您带来了一些帮助,祝您生活愉快!

相关实践学习
自建数据库迁移到云数据库
本场景将引导您将网站的自建数据库平滑迁移至云数据库RDS。通过使用RDS,您可以获得稳定、可靠和安全的企业级数据库服务,可以更加专注于发展核心业务,无需过多担心数据库的管理和维护。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
目录
相关文章
|
6月前
|
缓存 负载均衡 监控
135_负载均衡:Redis缓存 - 提高缓存命中率的配置与最佳实践
在现代大型语言模型(LLM)部署架构中,缓存系统扮演着至关重要的角色。随着LLM应用规模的不断扩大和用户需求的持续增长,如何构建高效、可靠的缓存架构成为系统性能优化的核心挑战。Redis作为业界领先的内存数据库,因其高性能、丰富的数据结构和灵活的配置选项,已成为LLM部署中首选的缓存解决方案。
642 25
|
7月前
|
存储 缓存 NoSQL
Redis专题-实战篇二-商户查询缓存
本文介绍了缓存的基本概念、应用场景及实现方式,涵盖Redis缓存设计、缓存更新策略、缓存穿透问题及其解决方案。重点讲解了缓存空对象与布隆过滤器的使用,并通过代码示例演示了商铺查询的缓存优化实践。
313 1
Redis专题-实战篇二-商户查询缓存
|
6月前
|
缓存 运维 监控
Redis 7.0 高性能缓存架构设计与优化
🌟蒋星熠Jaxonic,技术宇宙中的星际旅人。深耕Redis 7.0高性能缓存架构,探索函数化编程、多层缓存、集群优化与分片消息系统,用代码在二进制星河中谱写极客诗篇。
1045 3
|
7月前
|
缓存 NoSQL 关系型数据库
Redis缓存和分布式锁
Redis 是一种高性能的键值存储系统,广泛用于缓存、消息队列和内存数据库。其典型应用包括缓解关系型数据库压力,通过缓存热点数据提高查询效率,支持高并发访问。此外,Redis 还可用于实现分布式锁,解决分布式系统中的资源竞争问题。文章还探讨了缓存的更新策略、缓存穿透与雪崩的解决方案,以及 Redlock 算法等关键技术。
|
11月前
|
缓存 NoSQL 关系型数据库
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
美团面试:MySQL有1000w数据,redis只存20w的数据,如何做 缓存 设计?
|
11月前
|
缓存 NoSQL Java
Redis+Caffeine构建高性能二级缓存
大家好,我是摘星。今天为大家带来的是Redis+Caffeine构建高性能二级缓存,废话不多说直接开始~
1420 0
|
11月前
|
消息中间件 缓存 NoSQL
基于Spring Data Redis与RabbitMQ实现字符串缓存和计数功能(数据同步)
总的来说,借助Spring Data Redis和RabbitMQ,我们可以轻松实现字符串缓存和计数的功能。而关键的部分不过是一些"厨房的套路",一旦你掌握了这些套路,那么你就像厨师一样可以准备出一道道饕餮美食了。通过这种方式促进数据处理效率无疑将大大提高我们的生产力。
338 32
|
11月前
|
缓存 NoSQL Java
Redis:现代服务端开发的缓存基石与电商实践-优雅草卓伊凡
Redis:现代服务端开发的缓存基石与电商实践-优雅草卓伊凡
268 5
Redis:现代服务端开发的缓存基石与电商实践-优雅草卓伊凡
|
存储 缓存 NoSQL
解决Redis缓存数据类型丢失问题
解决Redis缓存数据类型丢失问题
565 85
|
缓存 NoSQL Java
Redis应用—8.相关的缓存框架
本文介绍了Ehcache和Guava Cache两个缓存框架及其使用方法,以及如何自定义缓存。主要内容包括:Ehcache缓存框架、Guava Cache缓存框架、自定义缓存。总结:Ehcache适合用作本地缓存或与Redis结合使用,Guava Cache则提供了更灵活的缓存管理和更高的并发性能。自定义缓存可以根据具体需求选择不同的数据结构和引用类型来实现特定的缓存策略。
848 16
Redis应用—8.相关的缓存框架