开发者社区> 问答> 正文

Hive 数仓表中小文件是如何产生的呢?

Hive 数仓表中小文件是如何产生的呢?

展开
收起
游客qzzytmszf3zhq 2021-12-09 20:47:37 498 0
1 条回答
写回答
取消 提交回答
  • 动态分区插入数据,产生大量的小文件,从而导致 map 数量剧增 reduce 数量越多,小文件也越多( reduce 的个数和输出文件是对应的) 数据源本身就包含大量的小文件

    2021-12-09 20:47:47
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载