如果是数据中台或者大数据从0到1的组织,或者没有太多落地经验的组织,首先要考虑如何避免如下的坑:
1.目标不明确、期望值过高、成本收益不清晰
家里到底有多少数据?大数据能实现什么样的目标?投入大概有多少?
是不是上了大数据就可以看到财务指标的提升?
我见过总共几个G的数据,买套BI就能解决还要花费几百万上大数据平台的案例,
也见过花费了几百万打造大数据平台只产出了一张大屏的案例。
2.缺乏战略规划和持续投入
对大部分企业型组织来说,大数据往往是伴随数字化经营战略进行规划的,要跟企业战略保持一致。
数据团队的建设包含团队搭建、设备采购、平台建设、预期百万级至千万级启动资金,每年数百万的持续投入,如果没有长远的规划和持续的投入很容易就会陷入半途而废的境地。
关于数据中台, 这个概念本身可能目前还有争论,我个人认为数据中台最核心的价值是把数据真正的纳入到业务闭环当中,实现业务数据化+数据业务化,而不仅仅停留在数据看板、分析报告上。
关于如何选型,建议参考下面的步骤:
先对自身的信息系统、数据资源进行调研,对数据量、数据类型、数据价值进行分析。
从组织各个层面挖掘潜在的数据需求(营销、预测、查询、数据交换等),对经营指标体系和业务流程进行分析,考虑如何利用数据中台将数据融入到业务闭环当中。
案例分析,寻找同行业数据中台的实施案例,但是需要仔细鉴别宣传中给出的各种数字,结合自身的业务判断是否符合自身的要求。
路径选择,自研还是采购,开源还是商用产品,私有部署还是公有云,如果考虑最低成本的,可以全部采用开源解决方案进行组合,比如
数据中台架构里面包括数据采集、数据存储、数据计算、数据治理、数据服务五大部分,前三个大家都差不多,更多的是技术指标,最值得关注的是数据治理和数据服务两部分:
1)数据治理主要包括数据标准、数据质量和数据安全三部分,这三部分功能各家厂商的产品设计各有差异。也有一些针对行业特殊的设计,特别是数据标准,有些行业经验比较丰富的厂商通常会提供相应的经过实践检验的模板。
2)数据服务主要包括数据目录、标签工厂、数据分析、数据服务接口、算法模型等,各家厂商的支持程度以及设计差异也较大,有一些产品会内置一些针对行业的一些功能。
产品实施,一般采购产品的话会配套一个实施的项目,会把一些基础的数仓规划设计、数据采集、数据标准实现出来,并结合产品完成一套符合客户的数据开发流程、数据开发规范、数据运维规范。