数据湖可以从两个层面去理解。第一个是较静态的含义,指一个企业所有数据的集合,它反映了大数据的每个方面,数据来源的多样性,数据格式的多样性,巨大的数据体量以及数据快速生成等,这些都是大数据的典型特性。 更重要的一点是,它指一个比较动态的从端到端的数据处理框架,从原始数据开始,然后到基本的数据处理,然后把它存储到企业的中心的数据库里面,接着做进一步的分析处理,产生商业决策的信息,进而让下游系统利用,数据可视化的商业智能数据科学人工智能等。 答复内容摘自《Cassandra实战指南》,这本电子书收录开发者藏经阁 下载连接:https://developer.aliyun.com/topic/download?id=7881
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。