解锁新姿势 | 如何用配置中心实现全局动态流控?

简介: 当资源成为瓶颈时,服务框架需要对消费者做限流,启动流控保护机制。流量控制有多种策略,比较常用的有:针对访问速率的静态流控、针对资源占用的动态流控、针对消费者并发连接数的连接控制和针对并行访问数的并发控制。在实践中,各种流量控制策略需要综合使用才能起到较好的效果。

在分布式架构中,应用和应用之间的调用类型分为以下两种,流控方式也略有不同。

同步RPC类调用,比如RESTful,Dubbo,HSF等都属于该类。对于该类同步调用,通常限流方式为两种:针对服务提供者的并发全局流控,或针对服务消费者的并发局部流控。两种的控制手段类似,都是通过限制服务端或客服端并发调用数来进行限制。

异步MQ类调用,典型如RocketMQ,      Kafka,等。对于该类异步调用,通常限流方式是在订阅端限流。限流方式为两种:针对消息订阅者的并发流控,或针对消息订阅者的消费延时流控。

针对消息订阅者的消费延时流控基本原理是,在每次客户端消费时,可以增加一个延时来控制消费速度,这样理论消费并发最快速度为:

MaxRate = 1 / ConsumInterval * ConcurrentThreadNumber

比如如果消息并发消费线程为20,延时为100ms,则理论上可以将并发消费控制在200以下。具体公式如下:

200 = 1 / 0.1 * 20

相比并发线程数流控,消费延时流控优点在于实现相对简单,对MQ类客户端包依赖较少,不需要客户端提供控制并发线程数的动态调整接口。

以上各种流量控制方法,在分布式架构下,如果要做到全局动态控制,一个简单的技术方法是依赖配置中心,即通过配置中心来进行流控参数的下发。

下面章节详细介绍如何基于配置中心来实现异步消息消费的全局动态流控。使用的例子为阿里云上的 MQ (消息队列)和 ACM (应用配置管理)两款产品。

注:之所以用MQ为示例是因为在本文撰写之时,正好MQ Consumer Client SDK并不支持动态调整现成并发数,因此通过基于ACM来动态调整消费延迟的方法正好可以解决MQ消费流控动态的问题。

基于消费延时流控的基本原理

基本原理如下。其中,管理员或应用程序通过ACM控制台发布消费延时配置(RCV_INTERVAL_TIME),所有MQ消费程序订阅该配置。理论上,该配置从发布到下发所有客户端,可以在1秒内完成(取决于网络演示)。

8a6af60491405721f48152e02dd48061281bbd73

代码示例

该章节基于配置中心来实现异步消息消费的全局动态流控的代码示例。使用的例子为阿里云上的MQ(消息队列)和ACM(应用配置管理)两款产品,基于Java语言。关于SDK的详细介绍,可参见两款产品的官方文档。

在ACM上创建消费延时的参数,截屏如下。

d77e20cf46705d493c022f52e87526394b56350b

设置全局消费延时变量

首先,设置消费接收延时的全局变量, 如下。

  // 初始化消息接收延时参数,单位为millisecond

            static int RCV_INTERVAL_TIME = 10000;

            // 初始化配置服务,控制台通过示例代码自动获取下面参数

            ConfigService.init("acm.aliyun.com", /*租户ID*/"xxx", /*AK*/"xxx", /*SK*/"yyy");    

            // 主动获取配置

            String content = ConfigService.getConfig("app.mq.qos", "DEFAULT_GROUP", 6000);

            Properties p = new Properties();

            try {

                p.load(new StringReader(content));

                RCV_INTERVAL_TIME = Integer.valueOf(p.getProperty("RCV_INTERVAL_TIME"));

            } catch (IOException e) {

                e.printStackTrace();

            }

其次,设置ACM listener,确保当配置被修改时,即使更新 RCV_INTERVAL_TIME 参数, 如下。

// 初始化的时候,给配置添加监听,配置变更会回调通知

            ConfigService.addListener("app.mq.qos", "DEFAULT_GROUP", new ConfigChangeListener() {

                public void receiveConfigInfo(String configInfo) {

                    Properties p = new Properties();

                    try {

                        p.load(new StringReader(configInfo));

                        RCV_INTERVAL_TIME = Integer.valueOf(p.getProperty("RCV_INTERVAL_TIME"));

                    } catch (IOException e) {

                        e.printStackTrace();

                    }

                }

            });

设置 MQ 消费延时逻辑


完整实例如下。

注:这里 RCV_INTERVAL_TIME 参数的访问是故意没有加锁的,读者可以自行思考原因。Aliyun ONS Client不提供动态线程并发数,默认并发为20。因此这里正好使用消费延时参数来动态调节QoS。

//以下代码可直接贴在Main()函数里

        Properties properties = new Properties();

        properties.put(PropertyKeyConst.ConsumerId, "CID_consumer_group");

        properties.put(PropertyKeyConst.AccessKey,"xxx");

        properties.put(PropertyKeyConst.SecretKey, "yyy");

        properties.setProperty(PropertyKeyConst.SendMsgTimeoutMillis, "3000");

        // 设置 TCP 接入域名(此处以公共云生产环境为例)

        properties.put(PropertyKeyConst.ONSAddr,

          "http://onsaddr-internet.aliyun.com/rocketmq/nsaddr4client-internet");

        Consumer consumer = ONSFactory.createConsumer(properties);

        consumer.subscribe(/*Topic*/"topic-name", /*Tag*/null, new MessageListener() 

        {

            public Action consume(Message message, ConsumeContext context) {

                // MQ Subscribe QoS logical start, 

                // Each consuming process will sleep for RCV_INTERVAL_TIME seconds with 100 ms sleeping cycle.

                // Within each cycle, the thread will check RCV_INTERVAL_TIME in case it's set to a smaller value. 

                // RCV_INTERVAL_TIME <= 0 means no sleeping.

                int rcvIntervalTimeLeft = RCV_INTERVAL_TIME;

                while (rcvIntervalTimeLeft > 0) {

                    if (rcvIntervalTimeLeft > RCV_INTERVAL_TIME) {

                        rcvIntervalTimeLeft = RCV_INTERVAL_TIME;

                    }

                    try {

                        if (rcvIntervalTimeLeft >= 100) {

                            rcvIntervalTimeLeft -= 100;

                            Thread.sleep(100);

                        } else {

                            Thread.sleep(rcvIntervalTimeLeft);

                            rcvIntervalTimeLeft = 0;

                        }

                    } catch (InterruptedException e) {

                        e.printStackTrace();

                    }

                }

                // MQ Subscribe interval logical ends

                System.out.println("Receive: " + message);

                /*

                 * Put your business logic here.

                 */

                doSomething();

                return Action.CommitMessage;

            }

        });

        consumer.start();

运行结果


单机运行consumer进行消费,假设queue内的消息无限多,不存在消费万的情况,分三段测试,分别运行约5分钟,通过ACM配置推送来达到以下效果。

RCV_INTERVAL_TIME      = 100 ms

RCV_INTERVAL_TIME      = 5000 ms

RCV_INTERVAL_TIME      = 1000 ms

结果如下,在单MQ消费业务处理耗时约100ms情况下的,单机并发20线程的测试结果。

RCV_INTERVAL_TIME  = 100 ms:平均消费性能约为 9000 tpm 左右

RCV_INTERVAL_TIME  = 5000 ms:平均消费性能被限制到了 200 tpm 左右

RCV_INTERVAL_TIME  = 1000 ms:平均消费性能回升到到了 1100 tpm 左右

以上结果基本达到消费和 tpm 成反比的预期,最关键的是整个过程中,应用不中断,流控推送结果秒级生效到分布式集群。单机性能结果如下所示。

31209e6536769067a959296f4a82122945984982

相关产品详情请参见:

  • 消息产品

Aliyun MQ:aliyun.com/product/ons

  • 配置中心产品

Aliyun ACM:aliyun.com/product/acm




原文发布时间为:2018-01-19

本文作者:杨奕

本文来自云栖社区合作伙伴“阿里技术”,了解相关信息可以关注“阿里技术”微信公众号

相关实践学习
快速体验阿里云云消息队列RocketMQ版
本实验将带您快速体验使用云消息队列RocketMQ版Serverless系列实例进行获取接入点、创建Topic、创建订阅组、收发消息、查看消息轨迹和仪表盘。
消息队列 MNS 入门课程
1、消息队列MNS简介 本节课介绍消息队列的MNS的基础概念 2、消息队列MNS特性 本节课介绍消息队列的MNS的主要特性 3、MNS的最佳实践及场景应用 本节课介绍消息队列的MNS的最佳实践及场景应用案例 4、手把手系列:消息队列MNS实操讲 本节课介绍消息队列的MNS的实际操作演示 5、动手实验:基于MNS,0基础轻松构建 Web Client 本节课带您一起基于MNS,0基础轻松构建 Web Client
相关文章
|
Dubbo Java 应用服务中间件
史上最全 40 道 Dubbo 面试题及答案,看完碾压面试官!
想往高处走,怎么能不懂 Dubbo? Dubbo是国内最出名的分布式服务框架,也是 Java 程序员必备的必会的框架之一。
3986 0
|
移动开发 HTML5
一个最简单的 HTML 页面结构如下:
HTML 是一种标记语言,用于描述网页结构。通过 `&lt;html&gt;`, `&lt;head&gt;`, `&lt;body&gt;` 等标签构建页面,支持文本、图像、链接、表格等多种元素。本文介绍了 HTML 基础,包括常用标签及创建简单网页的实例,帮助初学者快速入门。
325 0
|
10月前
|
算法 NoSQL 应用服务中间件
阿里面试:10WQPS高并发,怎么限流?这份答案让我当场拿了offer
在 Nacos 的配置管理界面或通过 Nacos 的 API,创建一个名为(与配置文件中 dataId 一致)的配置项,用于存储 Sentinel 的流量控制规则。上述规则表示对名为的资源进行流量控制,QPS 阈值为 10。resource:要保护的资源名称。limitApp:来源应用,default表示所有应用。grade:限流阈值类型,1 表示 QPS 限流,0 表示线程数限流。count:限流阈值。strategy:流控模式,0 为直接模式,1 为关联模式,2 为链路模式。
阿里面试:10WQPS高并发,怎么限流?这份答案让我当场拿了offer
|
XML 监控 负载均衡
Jacoco的覆盖率原理
JaCoCo(Java Code Coverage)是一种广泛使用的代码覆盖率工具,通过在字节码中插入探针(Probe)来收集覆盖率信息。
1010 6
Jacoco的覆盖率原理
|
算法 Java 数据库
美团面试:百亿级分片,如何设计基因算法?
40岁老架构师尼恩在读者群中分享了关于分库分表的基因算法设计,旨在帮助大家应对一线互联网企业的面试题。文章详细介绍了分库分表的背景、分片键的设计目标和建议,以及基因法的具体应用和优缺点。通过系统化的梳理,帮助读者提升架构、设计和开发水平,顺利通过面试。
美团面试:百亿级分片,如何设计基因算法?
|
移动开发 JSON Java
Jmeter实现WebSocket协议的接口测试方法
WebSocket协议是HTML5的一种新协议,实现了浏览器与服务器之间的全双工通信。通过简单的握手动作,双方可直接传输数据。其优势包括极小的头部开销和服务器推送功能。使用JMeter进行WebSocket接口和性能测试时,需安装特定插件并配置相关参数,如服务器地址、端口号等,还可通过CSV文件实现参数化,以满足不同测试需求。
850 7
Jmeter实现WebSocket协议的接口测试方法
|
SQL 分布式计算 Hadoop
Apache Hive 帮助文档
Apache Hive 帮助文档
637 9
|
数据采集 缓存 NoSQL
三级缓存实操系列(一)
三级缓存实操系列(一)
|
消息中间件 存储 Java
Kafka 如何避免重复消费?
在Apache Kafka中,避免消息的重复消费是确保数据准确处理的关键。本文详细介绍了七种避免重复消费的方法:使用消费者组、幂等生产者、事务性生产者与消费者、手动提交偏移量、外部存储管理偏移量、去重逻辑及幂等消息处理逻辑。每种方法均有其优缺点,可根据实际需求选择合适方案。结合消费者组、手动提交偏移量和幂等处理逻辑通常是有效策略,而对于高一致性要求,则可考虑使用事务性消息。
2287 0
|
存储 监控 算法
【JVM】如何定位、解决内存泄漏和溢出
【JVM】如何定位、解决内存泄漏和溢出
822 0