备案控制台

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

为什么HDFS只适用于大型数据集而不适用于许多小文件？

为什么HDFS只适用于大型数据集而不适用于许多小文件？

展开

收起

南霸天霸南北 2019-11-07 20:07:59 5040 0

1 条回答

写回答

取消提交回答

南霸天霸南北

阿里云头部开发者运营小二

这是由于NameNode的性能问题。通常，NameNode被分配了巨大的空间来存储大规模文件的元数据。元数据应该来自单个文件，以实现最佳的空间利用率和成本效益。对于小尺寸文件，NameNode不使用整个空间，这是性能优化问题。

2019-11-07 20:08:12

赞同展开评论打赏

问答分类：

云原生大数据计算服务 MaxCompute

问答标签：

文件存储HDFS版文件文件存储HDFS版小文件文件存储HDFS版数据集

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

大佬们，flink sql写hdfs怎么控制小文件数量啊？配置了一堆参数，都没效果啊

99

1

0

为什么下载了Hadoop之后直接能够在Linux系统上运行hdfs文件呀？

1070

1

0

Linux文件系统中是怎么运行HDFS文件的呀？

843

1

0

HDFS存储的文件之间的映射关系是什么样子的呀？

730

1

0

HDFS当中文件是怎么存储的呀？

646

1

0

HDFS中登陆客户端要对文件进行操作时会先在哪里找文件的位置呀?

598

1

0

Java中HDFS为什么不能存小文件啊？

1621

1

0

flink任务取消产生的hdfs中间状态文件怎么解决呢？哪位大佬知道啊？任务取消计算结果落到hdfs

1207

1

0

我现在碰到了批处理读取数据不落盘，全读完才去sink，这个临时文件我要怎么去找，是在hdfs里面吗？

479

1

0

老哥们有没有遇到过这个问题，hdfs上文件明明存在，它报错说不存在，怎么办？

1222

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

热门讨论

热门文章

请问大数据计算MaxCompute pyodps 如何读取 oss 里的文件?

百问求答（5）MaxCompute专场！回答问题赢SKG颈椎按摩仪等好礼

大数据计算MaxCompute ODPS-0010000:System internal这个怎么办？

大数据计算MaxCompute钉钉机器人发报警webhook调用量到上限了，这个怎么处理？

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

MaxCompute中的UDF函数是不是不能进行http请求

Maxcompute中如何处理expect equality expression (i.e., o

大数据计算MaxCompute运行节点出现这种报错？

MaxCompute分区表需要开启全表扫面吧？或者单独查询某一个分区。怎么开启全表扫描呀？

DataWorks中kafka同步数据到maxcomputer，kafka消费策略设置这样会报错？

展开全部

MaxCompute上如何处理非结构化数据

MaxCompute访问TableStore(OTS) 数据（20170601更新）

【干货合集视频+资料下载】2019大数据技术公开课第三季 | 阿里巴巴大数据产品最新特性介绍

MaxCompute助力OSS支持EB级计算力

80后阿里P10，“关老板”如何带着MaxCompute一路升级？

阿里云大数据计算服务MaxCompute（原ODPS）华南1（深圳）Region即将开服！

京信通信：数据智能为生产调试“增效瘦身”

MaxCompute_SQL_开发指南

Mars 开源月报（2020.3）

电商数据分析的方法

展开全部

相关课程

更多

Hadoop 分布式文件系统 HDFS

1187

43

去学习

Hadoop企业优化及扩展案例

432

7

去学习

分布式文件存储系统技术及实现

6190

15

去学习

相关电子书

更多

海量数据分布式存储——Apache HDFS之最新进展 立即下载

实战-如何基于HBase构建图片视频数据的统一存储检索方案 立即下载

Hadoop存储与计算分离实践 立即下载