开发者社区> 问答> 正文

HDFS的数据仓库有什么用?

HDFS的数据仓库有什么用?

展开
收起
游客fbdr25iajcjto 2021-12-09 20:15:45 373 0
1 条回答
写回答
取消 提交回答
  • 数据仓库是大数据的典型场景

    每天的 ETL 作业新增大量数据

    Hive 支持分区表,使用分区可以快速裁剪数据

    Hive 数仓中大量 Hive 表以时间日期作为分区字段

    在数仓中很多表的较老的日期分区平常一般不会被访问,可以考虑把这部分数据移出 HDFS Hive 的每个分区都有自己的 storagedescriptor,可以有单独的存储路径

    2021-12-09 20:16:16
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
基于HBase实时数仓探索实践 立即下载
海量数据分布式存储——Apache HDFS之最新进展 立即下载
零基础实现hadoop 迁移 MaxCompute 之 数据 立即下载