1.集群容错架构设计

简介: 本文深入剖析Dubbo集群容错机制,围绕Directory、Router、LoadBalance三大核心组件,结合源码与流程图,解析服务调用时如何实现服务发现、路由过滤与负载均衡,助你掌握整体架构设计精髓。

前期铺垫

官网介绍图.png


这张是官网的对于集群容错的架构设计图,即使你有一定的使用经验,第一眼看到这个图可能还是有些懵逼.因为这个图是从设计的角度画出来的,而不是使用的角度.但是即使这个图你看不懂也不影响你对本文的阅读,但是你必须要记住三个关键词,因为这三个关键词接下来会贯穿全文,他们就是Directory,Router,LoadBalance

再接下来给大家一张"地图","地图"上我已经标记了序号,再下面的源码分析中,我也会实时提醒我们所在的位置,以至于不会迷失方向.

执行时序图.png

环境准备

既然是集群,那么首先要启动两个Provider,我这里是一个虚拟机,一个本地的方式,因为环境准备不是本文重点,因此略过.本文所用到的源码是2.5.4版本,可以在guihub上找到。也可以用下面这个2.7.0版本的:

📎dubbo-2.7.0.jar

正式发车

这次示例选用的源码用dubbo-demodubbo-demo-consumer,如果对dubbo原理有些简单的了解就知道,他给接口注入的不是接口的实现类,而是一个代理类,如下图


接着自然是到了代理类的invoke方法里,从图中我们也可以看出,他用的是jdk的动态代理



下面要开始紧盯着地图了,他现在就要开始执行地图中的序号1,此时我们抵达MockClusterInvoker这个类


执行invoke就要开始进入到集群,也就是Cluster,现在第一个关键词Directory已经浮出水面了

现在到了AbstractDirectory,也就是序号3

这个methodInvokerMap也比较重要,后面的文章会讲一下这个,但是我们这部分代码就可以从出,他是要从methodInvokerMap中取出invokers如图所示

将invokers返回后(序号5),下面来到了第二个关键词,Router,开始进入路由,现在我们到了序号6,此时到了MockInvokersSelector类,不要看类名和Router没有关系,其实他是Router接口的实现类,从官网的介绍图中我们也可以看到Router分为ScriptCondition两种,翻译过来也就是脚本路由条件路由这个后面再详细介绍,本篇主要介绍整体架构

源码的命名是很规范的,从getNormalInvokers就可以得知,他是要拿到能正常执行的invokers,并将其返回.也就是序号7

这个时候我们再次回到了AbstractClusterInvoker这个类,我们先不急着往下走,先适时做个总结.因为三个关键词,现在都已经出现了两个,那这个时候要回忆一下上面这些步骤,做一个总结.上面出现的这两个关键词,其实无非就是做两件事

  • Directory中找出本次集群中的全部invokers
  • Router中,将上一步的全部invokers挑选出能正常执行的invokers

对应到"地图",也就是序号5和序号7.(再次提醒,一定要紧跟地图的序号,不然很容易迷失方向)

从上面步骤我们也知道,已经挑选出能正常执行的invokers了,但是假如2个做集群,但是这两个都是正常的,我到底要执行哪一个呢?带着这个问题,我们继续往下看

根据官网的描述

在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。

所以这个时候是到了FailoverClusterInvoker类,但是如果你配置的是Failfast Cluster(快速失败),Failsafe Cluster(失败安全),Failback Cluster(失败自动恢复),Forking Cluster(并行调用多个服务器,只要一个成功即返回),Broadcast Cluster(广播调用所有提供者,逐个调用,任意一台报错则报错)他也会到达相应的类

下面就要开始第三个关键词浮出水面,也就是LoadBalance(负载均衡),此时的位置是序号11

根据前面我们知道,现在已经有两个备选的invokers,但是究竟哪一个能执行,这个需要LoadBalance来决定.这里涉及到了一定的算法,后面我也会有一篇文章加以介绍.剧透一下,这个在2.5.4的版本中,这个算法还是存在一些小的bug,此时我们的位置是序号13

到达终点站.我们回忆总结一下,文初提到的三个关键词,在这个集群容错的整体架构过程中,dubbo究竟做了什么.其实也就是三件事

  • Directory中找出本次集群中的全部invokers
  • Router中,将上一步的全部invokers挑选出能正常执行的invokers
  • LoadBalance中,将上一步的能正常的执行invokers中,根据配置的负载均衡策略,挑选出需要执行的invoker

相关文章
|
消息中间件 Java 应用服务中间件
Spring Boot 的核心注解有哪些?
【2月更文挑战第9天】
624 0
Spring Boot 的核心注解有哪些?
langchain 入门指南 - 使用 Agent
langchain 入门指南 - 使用 Agent
823 0
|
4月前
|
自然语言处理 数据可视化 Docker
安装ES、Kibana、IK
本文介绍如何通过Docker部署单节点Elasticsearch与Kibana,并安装IK分词器。内容涵盖创建网络、加载镜像、运行容器、配置扩展词典与停用词典,以及常见启动报错处理,帮助快速搭建ES开发环境。
安装ES、Kibana、IK
|
4月前
|
SQL 容灾 Nacos
Seata的部署和集成
本文介绍Seata TC服务器的部署与微服务集成,包括下载、配置、数据库表初始化及高可用集群搭建,实现基于Nacos的分布式事务管理与异地容灾支持。
|
4月前
|
负载均衡 应用服务中间件 Nacos
Nacos配置中心
本文详细介绍如何使用Nacos实现微服务配置中心,涵盖配置管理、热更新、共享配置及优先级规则,并演示Nacos集群搭建与高可用部署,提升系统可维护性与稳定性。
 Nacos配置中心
|
4月前
|
Kubernetes Java 应用服务中间件
1.开发篇(脚手架下载)
本文介绍基于SpringCloud + Kubernetes的微服务开发实践,重点分享EDAS 3.0在项目初始化与本地启动环节的优化体验。通过阿里云start.aliyun.com脚手架快速生成项目,结合Cloud Toolkit插件一键拉起本地注册中心,实现应用快速部署与联调,提升开发者效率。后续将深入讲解云端部署及端云互联能力。
|
4月前
|
NoSQL Linux 网络安全
Redis集群部署指南
本章介绍CentOS7下Redis集群搭建,涵盖单机安装、主从复制、哨兵高可用及分片集群配置,通过实操命令与图示详解各集群模式的部署与测试过程。
|
4月前
|
消息中间件 负载均衡 Linux
RabbitMQ部署指南
本文介绍RabbitMQ在CentOS7中基于Docker的单机与集群部署方案,涵盖镜像安装、DelayExchange插件配置、普通集群与镜像模式搭建,并详细演示仲裁队列使用及集群扩容方法,助力实现高可用消息队列服务。
 RabbitMQ部署指南
|
人工智能 运维 监控
阿里云Milvus产品发布:AI时代云原生专业向量检索引擎
随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。
LangChain-26 Custom Agent 自定义一个Agent并通过@tool绑定对应的工具 同时让大模型自己调用编写的@tools函数
LangChain-26 Custom Agent 自定义一个Agent并通过@tool绑定对应的工具 同时让大模型自己调用编写的@tools函数
842 3
LangChain-26 Custom Agent 自定义一个Agent并通过@tool绑定对应的工具 同时让大模型自己调用编写的@tools函数