开发者社区> 问答> 正文

RDS JindoFS 和 OSS-HDFS 有什么关系吗?

RDS JindoFS 和 OSS-HDFS 有什么关系吗?

展开
收起
鸡蛋灌饼儿 2023-01-15 18:29:04 312 0
1 条回答
写回答
取消 提交回答
  • "第一个考虑的是大数据的使用场景,首先根据业务使用场景选择集群,是批处理还是流处理,还是数据分析场景。根据不同的使用场景选择不同的集群。

    然后是节点选择,根据业务场景选择主实例(Master)、核心实例(Core)和计算实例(Task)。 Master节点主要部署Hadoop的Master进程。例如,NameNode和ResourceManager等。 生产集群建议打开高可用HA,E-MapReduce的HDFS、YARN、Hive和HBase等组件均已实现HA。生产集群建议在创建集群时开启高可用。如果创建集群时未开启高可用,则在后续使用过程中无法开启高可用功能。 Master节点主要用来存储HDFS元数据和组件Log文件,属于计算密集型,对磁盘IO要求不高。HDFS元数据存储在内存中,建议根据文件数量选择16 GB以上内存空间。 Core节点和Task节点的区别在于,Core节点会同时运行DataNode和Nodemanager。即便如此,还是建议您存储数据到OSS或者OSS-HDFS上,集群中的HDFS仅作为YARN任务分发的临时存储空间使用。您可以使用通用机型配合ECS云盘的方式来作为Core节点的机型配置。例如,g7.4xlarge + 4 * 100 GiB。 Task节点主要用来补充Core节点CPU和内存计算能力的不足,节点并不存储数据,也不运行DataNode。您可以根据CPU和内存需求来估算实例个数。

    然后是存储类型选择,可以采用高效云盘、本地盘、SSD云盘和SSD本地盘。磁盘性能为SSD本地盘 > SSD云盘 > 本地盘 > 高效云盘。 底层存储类型选择,底层存储类型支持OSS(仅标准型OSS)和HDFS。相对于HDFS,OSS的数据可用性更高,HDFS的数据可用性由云盘或本地盘存储的可靠性来保证。归档数据和深度归档数据需要解冻为标准型存储才能参与EMR引擎计算。 存储价格估算如下: 本地盘实例存储为0.04 元/GB/月 OSS标准型存储为0.12 元/GB/月 OSS归档型存储为0.033 元/GB/月 OSS深度归档型存储为0.015 元/GB/月 高效云盘存储为0.35 元/GB/月 SSD云盘存储为1.00 元/GB/月

    注意:为保证效率,应该部署E-MapReduce与业务系统在同一地域的同一个可用区。——该回答整理自钉群“企业运维训练营之大数据EMR原理与实践”

    2023-01-15 19:46:02
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
问答排行榜
最热
最新

相关电子书

更多
One Box: 解读事务与分析一体化数据库 HybridDB for MySQL 立即下载
One Box:解读事务与分析一体化数据库HybridDB for MySQL 立即下载
如何支撑HTAP场景-HybridDB for MySQL系统架构和技术演进 立即下载

相关镜像