开发者社区 问答 正文

CombineTextInputFormat怎么专门处理小文件?

CombineTextInputFormat怎么专门处理小文件?

展开
收起
芯在这 2021-12-06 22:21:34 368 分享 版权
1 条回答
写回答
取消 提交回答
  • 对于HDFS中的大量小文件,可以使用CombineTextInputFormat进行切片,它的切片逻辑与FileTextInputFormat不同,它可以将多个小文件从逻辑上划分到一个切片中,这样多个小文件就可以交给一个MapTask

    2021-12-06 22:23:20
    赞同 展开评论
问答地址: