在构建数据中台能力体系框架中,主链路”采“是指什么?
采:全域数据采集体系。
金融机构之前可能也建立了数仓、也建立了大数据平台,但是数据范围也许并没有覆盖全量数据。凡是有利于业务分析、业务使用的场景数据都需要进行采集。除了业务系统里存的结构化数据之外,还有大量非结构化数据、行为类数据需要分析,这些都要纳入到采集范围。
当然这种采集是在安全合规的前提下进行的,涉及到采集技术、采集数据内容以及配套相应的管理规范。过往采集技术是以文件加载的方式进行,后续在兼容模式的前提下采取主动化采集方式,主动通过数据源来去拉取相应的数据,并且能实现准时、实时的业务场景需求。
同时在管理规范方面,数据采集不是单纯的一项技术类工作,它是需要管理进行配套的。在采集的过程中不断地提升业务的可读性,使业务人员能够及时了解到采集的数据,在采集内容上不仅仅要围绕分析的业务场景数据,还有很多原数据的体系都需要采集过来,形成企业级原数据仓库,为后续数据资产建设提供基础数据保障。
资料来源:《数智新金融——数字新实践系列》下载链接:https://developer.aliyun.com/ebook/download/7572?spm=a2c6h.26392459.ebook-detail.3.689d1b2eHVSTA6
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。