开发者社区> 问答> 正文

MapReduce中的CombineTextInputFormat切片机制是什么?

MapReduce中的CombineTextInputFormat切片机制是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-04 20:01:33 310 0
1 条回答
写回答
取消 提交回答
  • 框架默认的TextInputFormat切片机制是对任务按文件规划切片,不管文件多小,都会是一个单独的切片,都会交给一个MapTask,这样如果有大量小文件,就会产生大量的MapTask,而创建MapTask的开销比较大,处理效率极其低下。

    2021-12-04 20:01:47
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink 流式应用中状态的数据结构定义升级 立即下载
HBase2.0重新定义小对象实时存取 立即下载
Hadoop存储与计算分离实践 立即下载