你们用flink,还用CDH那一套吗?还是都搭建apache原生的
使用Flink和CDH(Cloudera的分布式Hadoop管理平台)的选择主要取决于组织的具体需求和现有技术栈。
使用Apache Flink:
如果你需要进行实时流处理,可能会直接使用Apache Flink。Apache Flink是一个开源的、用于实时处理和批处理数据的流处理框架。
Apache Flink原生支持的特性和性能往往更加前沿,并且社区活跃,能够比较快速地得到新特性和Bug修复。
对于已有较强大的实时分析和流处理需求的用户,直接使用Flink可能更加合适。
使用Cloudera Data Hub (CDH):
CDH是一个集成了Hadoop生态系统众多组件的分布式数据处理和管理平台,包括HDFS、MapReduce、Hive、Impala、HBase等。
对于那些已经投资于CDH并且其功能能够满足需要的用户,可能会继续使用CDH。CDH的一大优势是它提供了企业级的支持和服务。
CDH也可以与Flink结合使用,但这通常意味着需要额外进行集成和配置工作。
随着时间的推移,许多组织可能会转向使用Apache原生的技术栈,特别是对于新的项目或当需要进行现代化的数据平台建设时。Apache原生的技术栈通常能够提供更加灵活和轻量级的解决方案,而且能更快速地响应开源社区的创新。
此外,CDH的继任者Cloudera Data Platform (CDP)提供了一个混合云数据平台,它支持多种工作负载和处理框架,包括Flink。这为用户提供了一个从CDH过渡到更现代解决方案的路径。
阿里云支持使用Flink和CDH,用户可以根据自己的需求选择使用Apache原生的Flink或者CDH的Flink。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。