《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(1)

简介: 《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(1)

客户案例:工业OT 域数据最佳实践


作者:张为,阿里云全球技术服务部


一、 传统维度建模的方案介绍


数仓建设中常用的方式是维度建模,其核心是将原表分为事实表和维度表。然后采用星型模型或者雪花模型进行数据建模。星型模型,是一种非常简单常用的模型,事实表直接和多个维度表相连,维度表之间无连接。雪花模型,事实表与多个维度表相连,维度表之间有连接。


阿里内部在维度建模理论基础上,对数据的分层分域、维度一致性、事实表设计、原子指标/派生指标的定义及设计等做了细化定义,同时定义了一套标准的从设计到开发的实施流程。


1. 维度建模工作流程


维度建模工作的实施流程如下图所示。


image.png


需求调研:分为自底向上和自顶向下两种,自底向上是从现有的业务系统入手,从业务上分析数据域、业务过程,了解数据需求。自顶向下是和实际报表使用人员了解需求,依据报表SQL 反向推导所需的数据源及指标信息。

数据域划分:对数仓建设涉及的数据类别进行划分,一般可以按照行业标准或者业务系统功能模块来划分。

指标设计:构建总线矩阵,梳理原子指标及派生指标清单,以及原子指标的溯源、派生指标的计算逻辑等。

数据建模:构建一致性维度,构建一致性度量及指标,分层设计DWD/DWS/DIM/ADS 模型。

数据开发:物理表创建,数据业务逻辑SQL 开发。

任务运维:数据开发任务运维。


从工作流程可以看出,维度建模的任务链路是比较长的,同时其工作量和指标规模基本成正比。涉及的指标量越多,调研、设计、开发的工作成比例的增加。


2. 维度建模使用场景及特点


维度建模广泛应用于IT 域数仓建设的场景中,该类场景的特点是原始数据来源于业务系统各功能模块,数据可以很自然的分为维度表和事实表,同时挂载到类似业务板块、业务过程这种概念上,通过统一的一套方法论即可对不同的场景、不同的数据源完成建模设计。虽然使用的建模方法论和流程是相同的,但是对于不同的指标设计是不同的,即当增加一个场景的指标时,需求调研、指标设计、模型设计、开发运维这个过程需要完整的走一遍,因此项目的实施工作量和指标数量基本成正比关系。





《全链路数据治理-智能数据建模 》——客户案例:工业OT 域数据最佳实践(2) https://developer.aliyun.com/article/1230884?groupCode=tech_library

相关文章
|
弹性计算 监控 数据可视化
ECS网络流量监控
ECS网络流量监控
926 2
|
消息中间件 Java Kafka
Flink与Kafka版本对应关系
Flink与Kafka版本对应关系
1904 0
Flink与Kafka版本对应关系
|
SQL 数据采集 运维
从数据到价值,DataOps精益数据运营概述
DevOps大家可能比较熟悉,但对于概念相近的DataOps大家可能还不清楚。简单来说,如果DevOps是更快交付软件的一种理念,那DataOps就是"更快交付高质量数据"的一种理念。 我们星轨工具团队过去围绕数据链路,沉淀了很多工具和组件,提升了我们数据域项目交付的效率和质量,这和DataOps提倡的聚焦数据链路,从全局提效很匹配。因此我们结合DataOps理念做了一些探索和实践,本文会详细给大家介绍下DataOps理念。
3340 2
从数据到价值,DataOps精益数据运营概述
|
8月前
|
人工智能 运维 安全
从“裸奔”到“金钟罩”:AI身份凭据安全的进化之路
构建身份权限安全,护航企业数据合规
1895 37
|
8月前
|
人工智能 自然语言处理 监控
Browser Use:打造你的浏览器自动化助手
你是否曾希望用简单的一句话就能让浏览器自动填表、抓数据或做测试?Browser Use 让这成为现实。它结合了语言模型的智能和传统自动化的稳定,能听懂自然语言指令,自己规划步骤,还能应对网页变动和错误。无论是开发者还是普通用户,都能用它高效完成日常操作,省时省力。安装简单,写行指令就能马上体验。
|
8月前
|
JavaScript 关系型数据库 MySQL
基于python的网上外卖订餐系统
本系统基于Python与Flask框架,结合MySQL数据库及Vue前端技术,实现了一个功能完善的网上订餐平台。系统涵盖餐品、订单、用户及评价管理模块,并深入研究订餐系统的商业模式、用户行为与服务质量。技术上采用HTML、PyCharm开发工具,支持移动端访问,助力餐饮业数字化转型。
|
移动开发 数据可视化 前端开发
tmagic - editor:大厂开源项目,零代码/低代码页面可视化编辑的利器,多端统一方案揭秘!如何用一套代码支持H5/PC,牛牛牛~~~
腾讯推出的开源项目 **tmagic-editor** 是一款所见即所得的页面可视化编辑器,支持H5、PC、TV等多种页面类型。它已应用于腾讯视频会员、腾讯会议等业务,每月生产和发布数百个页面,极大提高了开发效率。通过简单的拖拽和配置,非技术人员也能轻松创建复杂页面。tmagic-editor 支持 Vue2/Vue3 和 React 等多种前端框架,并提供了丰富的扩展功能,满足不同业务需求。
1766 3
|
人工智能 运维 关系型数据库
云栖大会|数据库与AI全面融合,迈入数据智能新纪元
2024年云栖大会「数据库与AI融合」专场,来自NVIDIA、宇视科技、合思信息、杭州光云科技、MiniMax等企业的代表与阿里云瑶池数据库团队,共同分享了Data+AI全面融合的最新技术进展。阿里云发布了DMS的跨云统一开放元数据OneMeta和智能开发OneOps,推出《云数据库运维》技术图书,并介绍了PolarDB、AnalyticDB、Lindorm和Tair等产品的最新能力,展示了AI在数据库领域的广泛应用和创新。
1295 15
|
Linux Android开发 iOS开发
使用Kivy创建“Hello World”应用并打包成APK
使用Kivy创建“Hello World”应用并打包成APK

热门文章

最新文章