开发者社区> 问答> 正文

Hadoop生态圈重点组件是什么?

Hadoop生态圈重点组件是什么?

展开
收起
游客yzrzs5mf6j7yy 2021-12-06 08:42:51 357 0
1 条回答
写回答
取消 提交回答
  • HDFS:Hadoop的分布式文件存储系统。

    MapReduce:Hadoop的分布式程序运算框架,也可以叫做一种编程模型。

    Hive:基于Hadoop的类SQL数据仓库工具

    Hbase:基于Hadoop的列式分布式NoSQL数据库

    ZooKeeper:分布式协调服务组件

    Mahout:基于MapReduce/Flink/Spark等分布式运算框架的机器学习算法库

    Oozie/Azkaban:工作流调度引擎

    Sqoop:数据迁入迁出工具

    Flume:日志采集工具

    2021-12-06 09:29:54
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
《构建Hadoop生态批流一体的实时数仓》 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载
CIO 指南:如何在SAP软件架构中使用Hadoop 立即下载