开发者社区> 问答> 正文

Mapreduce的数据输入优化方法是怎么实现的?

Mapreduce的数据输入优化方法是怎么实现的?

展开
收起
游客y244y7ln2rlpa 2021-12-05 14:39:18 313 0
1 条回答
写回答
取消 提交回答
  • Mapreduce的数据输入优化方法:

    (1) 合并小文件:在执行mr任务前将小文件进行合并,大量的小文件会产生大量的map任务,增大map任务装载次数,而任务的装载比较耗时,从而导致mr运行较慢。

    (2)采用ConbinFileInputFormat来作为输入,解决输入端大量小文件场景。

    2021-12-05 14:40:15
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
HBase 基本知识介绍及典型案例分析 立即下载
HBase基本知识介绍及典型案例分析 立即下载