1 数据库架构的发展历程
首先简单介绍一下数据库架构的发展历程,基本就是单体、主备、读写分离、分库分表,下面我们分别进行介绍。
1.1 单体架构
业务发展初期,数据库的压力相对较小,这时候使用单独一个库就可以。
引出的问题:如果数据库出现故障,我们的业务就不能使用,只能说是停机重启修复故障。
1.2 主备架构
由于单体带出的问题,这时候我们就需要加一个备用库,紧急情况可以用备库顶上,相当于加一个替补队员。
通过MySQL自带的主从同步机制,就可以放我们的替补队员上线。
当正式队员(主库)发生故障,我们就可以人工让其下线,让替补队员(备库)顶上。
引出的问题:随着业务大规模爆发,主库的压力过大,我们就想让备库承担起更大的责任来。
1.3 读写分离架构
读写分离架构本质也就是主备架构,与主备架构没有本质区别,就是在主备架构的基础上,增加一层对读写请求的处理,使其能够更大程度上利用备用库为我们分担一些读的压力。
读写分离架构,需要在中间加一层控制读写请求的路由
1.4 分库分表
分库分表的本质上是切分数据,是由于数据量级的提升,不对数据切分会严重影响数据库读写性能。
甚至是如果不切分,磁盘、内存、CPU无法承载这样的压力,数据库随时在奔溃的边缘。
分库分表与前三者是有本质区别的,分库分表后每一个库分片都可以采取以上三种方式的任意一种,可以是单体分片,也可以是主备分片,也可以是做了读写分离的分片。
分库分表和前三者中的一种是共生的关系。
不知道如何进行分库分表设计的可以读我之前的这篇文章《收好这份武林秘籍,让你分库分表再无烦恼》
2 读写分离设计方案
主从复制是MySQL数据库自带的功能,但是想要做读写分离就需要我们自己做一些工作配合MySQL主从同步配合使用。可选择的方案有很多。
2.1 代理
在应用程序和数据库之间增加代理层,代理层接收应用程序对数据库的请求,根据不同请求类型转发到不同的实例,实现读写分离的同时还可以实现负载均衡(读请求按照负载均衡的规则传入各个从节点)。
代理也就是借助中间件的方式,控制不同类型请求,进入不同的数据库。
目前常用的mysql的读写分离中间件有:
- MySQL-Proxy
MySQL自己的一个开源项目,通过其自带的Lua脚本进行SQL判断
- Atlas
Qihoo 360,在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。
- MyCat
- MaxScale
MariaDB 开发
- Amoeba
阿里开发
- ...
2.2 应用内路由
在程序中进行控制,我们利用持久层框架的拦截器实现,动态路由不同数据源。
利用Sharding-JDBC也可以实现
实现思路:
- 配置多数据源
- 设置默认的数据源,配置数据源的切换策略
- 拦截进入数据库的请求,根据业务需求设置走哪个数据源。
3 读写分离造成的读延迟怎么办?
凡是采用读写分离架构,就会有同步延迟问题,我们只能想办法去克服这个问题。
3.1 数据同步写入从库
主从复制模式,一般都是异步写数据到从库,当然这个异步也可以设置为同步,只有当从库写完成,主库上的写请求才能返回。
这种方案是最佳单也是最有效的一种,但也是性能最差的一种,尤其是有大量从库的情况下,严重影响请求效率。
3.2 缓存(中间件)路由法
写请求时缓存记录一个key,这个key的失效时间设置为主从同步的延时,读请求的时候先去缓存中确认是否存在key,如果key存在说明发生了写请求,数据未同步到从库,这时走主库即可,若不存在这个key,直接走从库的查询即可。
中间件应该也是可以判断是否同步完成,与使用缓存记录类似。
这种方案最大的弊端是引入了缓存,系统复杂度上升。
3.3 选择性强制读主库
对于一些特殊的业务场景,采用强制读主库。
弊端,需要把每一个这种情况都找出来,设置成强制走主库。
3.4 等GTID 方案
MySQL 在执行完事务后,会将该事务的 GTID 会给客户端,然后客户端可以使用该命令去要执行读操作的从库中执行,等待该 GTID,等待成功后,再执行读操作;如果等待超时,则去主库执行读操作,或者再换一个从库执行上述流程。
MariaDB 的 MaxScale 就是使用该方案,MaxScale 是 MariaDB 开发的一个数据库智能代理服务(也支持 MySQL),允许根据数据库 SQL 语句将请求转向目标一个到多个服务器,可设定各种复杂程度的转向规则。
3.5 以不变应万变
有延迟就有延迟,对数据强一致性要求不高的场景可以放任不管。