DRUID 是一个 JAVA 开发的 OLAP 计算以及存储引擎,他对数据是采取全索引大宽表的方式进行保存和处理。他内部本身就包含了 存储和计算能力。 KYLIN 是一个离线的预处理框架,它依赖于 SPARK 或者 YARN 去做计算,然后用 HBASE 里面保存预处理的结果。然后利用预处理结果进行展示。
DRUID 和 KYLIN 都对 HDFS 有依赖, DRUID 是把 HDFS 当做远程离线存储,但是实际的计算过程中并不使用。 而 KYLIN ,由于它是使用的 HADOOP 技术栈,所以中间计算过程和最后计算结果里面都会用到 HDFS。
DRUID 还有灵活的预聚合能力,可以利用 HYPERLOGLOG 算法做多维的 UV 聚合。 而 KYLIN 则是使用强大的位图计算,做了精确的 UV 计算能力。
总结下: druid 是一个带预聚合能力的多维 MLOAP 存储计算引擎, 只依赖 HDFS 做远程存储; KYLIN 是一个离线预聚合计算引擎, 依赖 HADOOP 做计算、HBASE 做结果保存; 官方介绍 druid: https://druid.apache.org/ kylin:http://kylin.apache.org/cn/
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。