用户背景
翼支付是中国电信的全资子公司,公司主要业务分为民生缴费、消费购物、金融理财,同时依托云计算、大数据、人工智能等技术手段,赋能线上及线下的商户。公司主要的业务板块分为数字生活、数字金融及金融科技服务。
业务需求
目前,翼支付的月活用户数为 5000万+,存量用户数 5 个亿+,线上的服务器大约 4000 台,每日的记录数为千亿条。随着公司的业务规模不断扩展,翼支付面临的业务挑战也在不断增多,主要表现在两个方面:
一方面,随着需求量的不断增多,采用定制化开发的方式使得应用的数量急剧增加,导致应用难以统一管理,各个业务线的应用向着烟囱式的方向发展,指标口径和计算不统一,重复的加工会造成能力的浪费;
另一方面,某些场景下的单 topic 数据量高达 220 万/秒,同时针对风控等场景,业务响应延迟要求 200 毫秒以内。
平台建设
针对业务需求和挑战,翼支付从2018年开始,结合行业的实践经验,积极探索建立实时加工体系。在2019年开始着手构建实时指标加工系统,引入SparkStreaming作为计算引擎。在 2020 年初出于对时效性的考虑,引入 StructuredStreaming 作为实时计算引擎。随着服务的应用不断增多,平台接收到依赖原子指标的组合的实时决策需求逐渐增多,因此在2020年9月份开始构建实时决策系统,将FlinkCEP引入系统中。2021年4 月份,为了解决一些复杂指标的加工需求,将 Flink SQL 引入到了指标加工链路中。经过产品的不断迭代,最终形成了一套企业化的智能决策系统——先鉴平台。
上图展示了先鉴平台的主要功能。首先是实时指标加工,目前支持多样化的数据源,主要包含常用的中间件比如 Kafka 及 Pulsar。同时为了降低用户的使用难度,提供了 23 种算法模板,也支持 SQL 的定制化加工方式。其次是实时决策,支持丰富的规则及规则组的嵌套组合,满足复杂决策的需求。此外平台还整合了实时、离线及第三方的标签,为用户提供统一的数据查询服务,同时为了生产的稳定性,平台提供了全面的监控功能和细粒度资源隔离、熔断、限流的策略,并且对 Source 及 Sink 的数据量和延迟都进行了相关的 Metrics 监控。
上图展示了先鉴平台的逻辑架构,主要分为 4 层。
• 最上层是应用调用方,主要包含智能风控、智能决策、智能营销系统;
• 第二层是实时决策模块,提供实时决策的功能,其中包含 Web 进行决策的配置及管理,同时提供开发中心进行决策任务的验证,通过决策核心进行实时的决策;
• 第三层是实时指标加工模块,通过用户配置不同的加工方式,录入到不同的执行引擎,同时整合数据服务,为用户提供结果查询;
• 最下面是数据层,数据源主要包含业务数据、用户的埋点数据以及集团加工的离线数据。最终根据用户的配置,将计算结果存储到相应的 DB。
《Apache Flink 案例集(2022版)》——5.数字化转型——翼支付Apache Flink 在翼支付的实践应用(下) https://developer.aliyun.com/article/1227822