Data Vault的一点思考(三)

本文涉及的产品
可视分析地图(DataV-Atlas),3 个项目,100M 存储空间
简介: 前段时间和一家互联网创新企业的数据架构师聊天,说他们正准备开始用Data Vault的模型进行数据仓库的建设,他们有一套维度建模的集市,但是维度建模的特点是更贴业务,但是对于数据的存储不是很友好,对于数据友好,他们是想在维度集市之前,加一层Data Vault的数据层。

前段时间和一家互联网创新企业的数据架构师聊天,说他们正准备开始用Data Vault的模型进行数据仓库的建设,他们有一套维度建模的集市,但是维度建模的特点是更贴业务,但是对于数据的存储不是很友好,对于数据友好,他们是想在维度集市之前,加一层Data Vault的数据层。_

其实这个数据架构也就很明白啦。ER来说太突出从上往下的关系,但是现在的创新企业的数据架构的关系还不明确,不好去表达,那Data Vault 是一个很好的选择,综合了ER和DM。同时还是保留原有的维度集市进行数据分析。这说明该企业已经有了一定的数据结构的大方向,只是细节还是不确定,那么Data Vault就是一个很好的载体,也是一个很好的解决方案。
有一点是需要探讨的是,习惯了维度建模的架构师,怎么去建立好这个数据层呢?有一点无法逾越的是,维度建模强调业务,就是有用的放在一块,如果面向数据,不可避免的是要对数据进行整理,那整理就会有类似主题的概念,所以个人认为Data Vault要有一个弱主题的形式存在,不然太散,Hub太多,不好维护。当然也不要像是ER那种强主题形式,也不适合。还有一点就是用ER地有一个特点就是业务逻辑简单,但是实际场景复杂,而DM是另外一方面,业务逻辑多变,但实际场景简单。但是当DM这一方,想去尝试多个场景的,同时业务逻辑会更多变时,那维度模型似乎就是支撑不了。因为应付一个场景的多变的需求还可以,和同时应付多个场景的多变需求,而且多个场景的数据之间还有关联,那么就需要一个能够体现关系的模型出现。Data Vault是一个很好的选择。
总结一下,数据越是需要反应关系,其路径就是如图所示,一步步递进,最终是ER。

相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
目录
相关文章
|
2月前
|
SQL 数据库
Result Set
【11月更文挑战第02天】
44 1
|
5月前
|
存储
【Azure Key Vault】关于Key Vault使用的几个问题
【Azure Key Vault】关于Key Vault使用的几个问题
|
7月前
|
关系型数据库 MySQL Linux
FATAL ERROR: Could not find my_print_defaults
FATAL ERROR: Could not find my_print_defaults
202 0
|
数据建模 大数据
Data Vault的一点思考(二)
现在的企业,只要是有点规模的,已经不仅仅是有ER这一套数据仓库模型来做数据,如现在很多企业从原有的线下转到线上,就不得不面临DM这一套数据模型,或者是线下和线上都有,而且是相互促进的(个人认为这是发展趋势的必然),但是貌似来说现阶段线上企业用DM这一套模型,现在更火,因为现在还是处在线下往线上发展的阶段,很多创业公司只要是线上的,数据的分析是必然,那怎么把数据组织好把数据给下游用,现在的主流是DM。
2909 0
|
SQL 机器学习/深度学习 Oracle