【组件开发实践】菜鸟天工--高可用数据服务组件

简介: 源于菜鸟数据中台,将异构数据源(数仓、关系型数据库、KV型数据库、搜索引擎)转化为高可用数据服务接口供上层应用访问,并提供数据管控、调试、限流、缓存加速、主/备切换服务。

如果你在日常工作中碰到包括但不限于以下任何关于数据服务相关问题请联系我们菜鸟(联系人:杨锋 jandon.yangf@alibaba-inc.com),我们将会为您提供专业的数据服务解决方案!


“冗长、低效的数据服务提供流程”

将 DB里的数据提供服务(HSF/HTTP)给别人访问,但是每次新增、修改一个接口都需要冗长的开发流程(建变更...改代码...发布),同时也缺少有效的动态调试工具


“数据服务高可用场景需求”

典型的如大促保障场景,需要应用具备数据源主、备链实时切换的功能。如果提供数据服务给外部系统,还需要为数据服务(接口)提供限流、缓存等降级能力


“数据复用及质量管理问题”

对于数据生产者而言,同样数据在不同业务中使用,如果各自系统维护接口逻辑,有时还需分别存储在各个业务系统DB,容易产生数据孤岛,浪费存储并且也不利于数据质量管控,对于使用者而言都需要重复构建一套数据通道来获取数据


“异构数据源重复学习和管理成本高”

数据使用场景不一样决定了数据存储的多样化(关系型DB,KV型DB,搜索引擎 等等),为了从这些数据源中获取数据,开发同学需要学习各个数据源接入API。如果存在异构数据源切换需要各自维护一套动态切换数据源的逻辑


“线上接口出错问题排查困难”

应用线上服务器少则几台十几台,多则几十台上百台,一旦数据接口出现问题则定位困难


天工发展史

天工诞生于菜鸟数据中台,起初是为了收口菜鸟数仓对外提供数据服务。随着对接的业务场景越来越多,产品的功能也经过了一个快速的迭代周期,同时为了满足菜鸟业务团队对于数据服务高质量要求,(数据服务)稳定性、可用性也逐渐成为天工后续发展的核心建设要素。概括来讲,天工从2016年至今发展经过了三大的阶段:

image.png


系统介绍

架构设计

image.png

核心组件

  • tg-client
  • 天工客户端: 分为 中心版和去中心版(富客户端)。去中心版功能基本上和中心版保持一致,不依赖天工线上服务器,关注更高可用性业务团队请选择富客户端
  • tg-web
  • 天工产品配置端 ,主要功能:数据源、表、接口配置、管理,接口诊断等
  • tg-engine
  • 天工核心执行引擎, 主要负责接口SQL的解析、语法树构建、执行优化(非性能优化部分)、数据源适配及查询下推等核心执行逻辑
  • tg-metadata
  • 天工元数据: 数据源、接口、表、单元等元信息。中心化模式下元信息存储于天工DB,去中心化方式则通过OSS进行解耦,由天工提供的富客户端定时拉去元信息到应用端


核心能力介绍

image.png

丰富的数据源支持

得益于天工设计之初考虑到数据源扩展性,对数据源进行了插件化处理,可快速、稳定(新增数据源插件对已有数据源无干扰)实现新数据源接入

目前天工支持阿里经济体大部分常用数据源: TDDL/ADB/Hologres(Postgresql)/Lindorm/ZSearch/OpenSearch/HSF等

image.png

目前天工支持大部分标准SQL语法(Mysql/Postgresql),对于一些存在特殊查询语法的数据源,比如opensearch,query查询里的filter需要和where区分开,标准SQL语义暂时无法支持,天工底层采用ANTLR自定义查询语法解析。


分钟级数据服务配置

天工分离了查询场景核心要素: 接口->逻辑表->数据源,采用统一DSL(SQL)屏蔽了底层数据源查询差异,使用户可以采用标准sql的方式获取需要的数据,极大的提高了数据服务配置效率。同时,在执行层采用动态生成mybatis配置方式实现接口配置热加载

创建一个数据服务只需要三步: 配置数据源(自助添加) -> 配置(逻辑)表 -> 配置接口

image.png


高可用性服务保障

限流

天工提供了对数据源、接口多维度限流措施

image.png

说明: 目前的限流是天工自己实现的一套算法,暂时只能进行并发度限制,不支持限制QPS


降级

对非重点场景接口直接进行服务禁用

image.png


缓存

接口级别缓存(同接口、同查询条件命中缓存)

image.png


主/备实时切换 -- 大促保障神器

得益天工逻辑表设计,数据服务运行时逻辑表-物理表替换, 可实现不修改SQL的情况下一键切换查询表

image.png


去中心化设计

核心设计理念: 引擎执行逻辑下推、引擎插件按需加载,OSS元数据解耦

优势: 执行逻辑完全下沉到客户端,减少了对中心服务器的依赖,避免因中心服务器波动引起服务的波动,极大的提高了数据服务的稳定性,建议后续接入方尽量采用富客户端模式

image.png


全链路监控 -- 异常排查神器

数据端到端访问链路监控,让线上(数据服务)问题得到快速定位

image.png

image.png


天工“出弹”计划

image.png

场景一是作为数字供应链控制塔(DSCT)独立可插拔的数据服务底座交付出弹, 目前已初步完成弹外方案验证: 产品端独立部署+客户端去中心化。同时我们也在积极推进和阿里云云巧平台合作,将天工作为独立的数据服务组件上架到阿里云资产市场拓展更多场景

联系我们:菜鸟技术专家 杨锋(jandon.yangf@alibaba-inc.com

相关文章
|
3月前
|
前端开发 JavaScript 编译器
前端研发链路之构建
本文首发于微信公众号“前端徐徐”,作者徐徐探讨了前端研发链路中的构建过程。文章介绍了构建器、JavaScript编译器和CSS编译器的作用及常见工具,详细解析了它们如何协同工作,提高开发效率和项目可维护性。适合前端开发者阅读,帮助理解现代前端构建体系。
27 1
前端研发链路之构建
|
8月前
|
数据可视化 前端开发 定位技术
地图作业平台低代码实战(搭建能力提升)
该内容是关于地图数据作业平台从大型WebGIS的“综合作业”模式向人机结合、所见即所得的“简单作业”模式转变的探讨。平台在低代码建设过程中,遇到的问题是如何让非研发人员(如产品经理、工艺人员)能独立搭建车间,而无需理解前端基本概念如事件驱动、数据不可变原则等。为解决这一问题,文章提出了数据筛选器和saveEffect对象的解决方案,简化了数据处理和组件间联动的实现,使非研发人员也能通过可视化方式构建组件通信和联动逻辑。此外,还展示了如何将普通UI组件接入saveEffect的改造方法。最后,文中提到了未来的规划,包括引入逻辑编排能力和图形化表达逻辑代码,以支持更复杂的车间搭建。
地图作业平台低代码实战(搭建能力提升)
|
8月前
|
监控 数据可视化 安全
智慧化工地SaaS平台源码,PC端+APP端+智慧数据可视化大屏端,源码完全开源不封装,自主研发,支持二开,项目使用,微服务+Java++vue+mysql
智慧化工地SaaS平台源码,PC端+APP端+智慧数据可视化大屏端,源码完全开源不封装,自主研发,支持二开,项目使用,微服务+Java++vue+mysql
161 0
|
数据可视化 BI
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解
带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——二、Dataphin 演进之路:产品大图及核心功能详解
427 0
|
消息中间件 SQL 存储
一文学会 ByteHouse 搭建数仓最佳实践
一文学会 ByteHouse 搭建数仓最佳实践
|
消息中间件 API Nacos
【组件开发实践】云巧流程组件对接实践
通过简单的业务场景进行举例,介绍如果通过云巧流程组件的API进行集成对接
31765 1
|
NoSQL 关系型数据库 MySQL
【云原生 | 拓展01】手把手教你搭建ferry开源工单系统
erry 是集工单统计、任务钩子、权限管理、灵活配置流程与模版等等于一身的开源工单系统,当然也可以称之为工作流引擎。 致力于减少跨部门之间的沟通,自动任务的执行,提升工作效率与工作质量,减少不必要的工作量与人为出错率。.....................
1762 0
【云原生 | 拓展01】手把手教你搭建ferry开源工单系统
|
运维 监控 网络协议
统一运维监控平台设计思路| 学习笔记
快速学习统一运维监控平台设计思路。
统一运维监控平台设计思路| 学习笔记
|
数据可视化 前端开发 Java
云巧组件如何实现代码架构设计可视化
在项目搭建完成进行了N个迭代之后,往往因为需求的变化以及设计的缺陷导致领域模型、接口、数据库设计等和最开始的时候大为不同,架构设计需要保鲜会花去大量的时间。有没有一种办法可以实时反应项目的各种技术设计呢?就像Swagger一样,代码自动生成文档。我们采用了静态代码扫描的方案,通过代码来反应真实的技术设计,这就是《云巧工坊-应用素描》的功能。
284 0
|
安全 前端开发 中间件
云巧核心组件巡礼 - 4A 统一安全管控组件
its better to run than curst the road初心相信很多小伙伴在刚刚接触项目交付时会发出相同的感慨项目交付的低水平。我们提出为企业做全面数字化转型很多年了。 但是在项目实际执行的过程中,常常的会陷入劳动密集型的堆人,堆代码的节奏中。 代码缺乏设计,稳定性听天由命。项目沉淀难因为项目 deadline 的紧迫,往往能成功交付便万事大吉。 虽然希望可以在项目中沉淀一些能力
云巧核心组件巡礼 - 4A 统一安全管控组件

热门文章

最新文章

下一篇
开通oss服务