数据中台如何建设,如何选型?

简介: 数据中台往往是伴随企业数字化经营战略进行规划的,是企业企业战略中的重要部分,数据中台建设包含团队搭建、设备采购、平台开发/采购等,预期百万级至千万级启动资金以及每年数百万的持续投入,所以如何建设、如何选型成为数据中台建设首先要考虑的事项。

如果是数据中台或者大数据从0到1的组织,或者没有太多落地经验的组织,首先要考虑如何避免如下的坑:
image.png
1.目标不明确、期望值过高、成本收益不清晰

家里到底有多少数据?大数据能实现什么样的目标?投入大概有多少?

是不是上了大数据就可以看到财务指标的提升?

我见过总共几个G的数据,买套BI就能解决还要花费几百万上大数据平台的案例,

也见过花费了几百万打造大数据平台只产出了一张大屏的案例。

2.缺乏战略规划和持续投入

对大部分企业型组织来说,大数据往往是伴随数字化经营战略进行规划的,要跟企业战略保持一致。

数据团队的建设包含团队搭建、设备采购、平台建设、预期百万级至千万级启动资金,每年数百万的持续投入,如果没有长远的规划和持续的投入很容易就会陷入半途而废的境地。

关于数据中台, 这个概念本身可能目前还有争论,我个人认为数据中台最核心的价值是把数据真正的纳入到业务闭环当中,实现业务数据化+数据业务化,而不仅仅停留在数据看板、分析报告上。

关于如何选型,建议参考下面的步骤:

先对自身的信息系统、数据资源进行调研,对数据量、数据类型、数据价值进行分析。
从组织各个层面挖掘潜在的数据需求(营销、预测、查询、数据交换等),对经营指标体系和业务流程进行分析,考虑如何利用数据中台将数据融入到业务闭环当中。
案例分析,寻找同行业数据中台的实施案例,但是需要仔细鉴别宣传中给出的各种数字,结合自身的业务判断是否符合自身的要求。
路径选择,自研还是采购,开源还是商用产品,私有部署还是公有云,如果考虑最低成本的,可以全部采用开源解决方案进行组合,比如
数据中台架构里面包括数据采集、数据存储、数据计算、数据治理、数据服务五大部分,前三个大家都差不多,更多的是技术指标,最值得关注的是数据治理和数据服务两部分:
1)数据治理主要包括数据标准、数据质量和数据安全三部分,这三部分功能各家厂商的产品设计各有差异。也有一些针对行业特殊的设计,特别是数据标准,有些行业经验比较丰富的厂商通常会提供相应的经过实践检验的模板。
2)数据服务主要包括数据目录、标签工厂、数据分析、数据服务接口、算法模型等,各家厂商的支持程度以及设计差异也较大,有一些产品会内置一些针对行业的一些功能。
产品实施,一般采购产品的话会配套一个实施的项目,会把一些基础的数仓规划设计、数据采集、数据标准实现出来,并结合产品完成一套符合客户的数据开发流程、数据开发规范、数据运维规范。

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
监控 Docker 容器
【Docker】9、Docker-Compose安装轻量级分布式日志服务Graylog
Graylog 是一个开源的日志聚合、分析、审计、展现和预警工具。在功能上来说,和 ELK 类似,但又比 ELK 要简单很多。
2823 1
【Docker】9、Docker-Compose安装轻量级分布式日志服务Graylog
|
SQL 存储 数据采集
数据中台建设方法论
数据中台建设方法论
|
5月前
|
机器学习/深度学习 人工智能 搜索推荐
数据中台的进化之路:从“管数据”到“懂业务”
数据中台的进化之路:从“管数据”到“懂业务”
337 3
|
Java API 数据库
如何使用Spring Boot构建RESTful API,以在线图书管理系统为例
【10月更文挑战第9天】本文介绍了如何使用Spring Boot构建RESTful API,以在线图书管理系统为例,从项目搭建、实体类定义、数据访问层创建、业务逻辑处理到RESTful API的实现,详细展示了每个步骤。通过Spring Boot的简洁配置和强大功能,开发者可以高效地开发出功能完备、易于维护的Web应用。
481 3
|
数据采集 存储 数据处理
数据治理:如何制定数据标准与规范
在当今这个数据驱动的时代,数据已成为企业最宝贵的资产之一。然而,随着数据量的爆炸性增长和数据来源的多样化,如何有效地管理和利用这些数据成为了企业面临的重大挑战。数据治理作为确保数据质量、安全性、合规性和可访问性的关键过程,其核心在于制定并执行一套科学、合理的数据标准与规范。本文将探讨如何制定数据标准与规范,以推动企业的数据治理实践。
2328 3
|
算法 Java
闲话银行家舍入法,以及在程序中如何实现
闲话银行家舍入法,以及在程序中如何实现
886 0
|
监控 NoSQL MongoDB
【MongoDB】MongoDB 服务无法正常启动问题排查
【4月更文挑战第2天】【MongoDB】MongoDB 服务无法正常启动问题排查
|
数据采集 人工智能 监控
赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源
Label-LLM 是一款专为大模型训练设计的多模态文本对话标注工具,支持团队协作,让标注工作变得简单高效。它不仅涵盖丰富的任务类型,如回答采集、偏好收集和内容评估等,还支持多模态数据标注,包括图像、视频和音频。Label-LLM具备预标注载入功能,能大幅提升工作效率,并提供全方位的任务管理与可视化分析,确保标注质量。快来体验这款强大的标注平台吧![部署文档](https://github.com/opendatalab/LabelLLM)
3513 0
赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源
|
Shell KVM 虚拟化
shell kvm 虚拟机镜像管理-自动创建删除停止和启动 qcow2 虚拟机
这是一个用于自动创建 KVM 虚拟机的 Bash 脚本。用户可以选择创建、删除、启动、关闭虚拟机或查看虚拟机的 IP 地址。脚本支持 Debian 12 和 Ubuntu 22.04 系统,并允许用户配置 CPU 线程数和内存大小。脚本会检查服务器的资源情况,确保输入的配置不会超过可用资源。
373 0
|
Ubuntu Linux C语言
【操作系统原理】—— 信号量与PV操作实现
【操作系统原理】—— 信号量与PV操作实现
1254 0

热门文章

最新文章