备案控制台

开发者社区 > 云原生 > 容器服务 > 正文

容器服务ASK中spark读云存储s3文件太慢的问题有遇到过吗？

容器服务ASK中spark读云存储s3文件太慢的问题有遇到过吗？

展开

收起

真的很搞笑 2024-03-12 19:35:11 68 0

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！

楼主你好，看了你的描述，可能是网络延迟，因为S3对象存储位于公共云上，可能存在网络延迟，你可以考虑将数据预先拷贝到ASK的本地存储中，然后进行Spark处理。

还有就是数据分布和并行度，如果S3上的数据量庞大，建议使用并行化的方式读取数据，以提高读取速度，可以将数据分割成多个小文件或使用Spark的并行处理能力来同时读取多个文件。

如果S3上的数据文件较大，可以考虑对数据进行压缩，减少网络传输时间，Spark支持多种压缩格式，如gzip、snappy、lz4等，可以尝试不同的压缩方式。

2024-03-13 08:53:52

赞同 1 展开评论打赏

问答分类：

容器分布式计算 Spark 存储

问答标签：

容器文件 apache spark文件容器服务ask 容器ask 容器spark

问答地址：

开发者社区 > 云原生 > 容器服务 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

容器服务Kubernetes版

为什么随着采集速率的增加，标准输出流采集的内存消耗会逐渐超过容器文件采集？

27

1

0

iLogtail的采集性能测试中，当输入速率为20M/s时容器文件采集和标准输出流采集的CPU使用率

50

1

0

在内存膨胀方面，无论是标准输出流采集还是容器内文件采集Filebeat和iLogtail的内存使用率

44

1

0

容器内文件采集配置膨胀的对比中采集配置从50增加到1000Filebeat和iLogtail的cpu

37

1

0

在容器内文件采集的内存对比中，Filebeat和iLogtail的内存使用情况如何随采集流量变化？

47

1

0

iLogtail采用什么机制进行容器内文件采集，并且相比标准输出流采集有何性能优势？

43

1

0

Filebeat在容器内文件采集相比于标准输出流采集在性能上有何变化？

49

1

0

输入日志速率从1M/s增加到3M/sFilebeat和iLogtail在容器内文件采集的CPU使用率

42

1

0

在容器内文件采集性能的对比中，Filebeat和iLogtail在1M/s输入日志速率下CPU使用率

44

1

0

iLogtail 的日志路径配置是如何指定容器内日志文件的？

116

1

0

云原生

容器服务

国内唯一 Forrester 公共云容器平台领导者象限。

我要提问

热门讨论

热门文章

怎么查看registry.aliyuncs.com/google_containers都有哪些镜像

registry.aliyuncs.com/google_containers这个镜像仓库都有啥镜像

阿里云发布的全球首个容器计算服务ACS，和已有的ASK有什么区别

容器服务ACK阿里镜像仓库哪里可以看到所有的镜像版本？

CSK中容器启动项的含义和作用

ACE tomcat 容器启动错误 No appenders are available for AsyncAppender Async

什么是aks，具体内容是什么？

你是怎么使用K8s的？

容器镜像服务ACR这个官方的镜像可以免费下载吗？

从阿里云镜像仓库中拉谷歌的k8s镜像，搭建k8s

展开全部

Docker CE 镜像源站

Minikube - Kubernetes本地实验环境

Docker的Windows容器初体验

当 Kubernetes 遇到阿里云

理解Docker容器的进程管理

利用Docker和阿里云容器服务轻松搭建TensorFlow Serving集群

Docker Engine 镜像源站

如何解决Docker容器和宿主机时间同步问题

免费的容器架构可视化工具 | 阿里云应用高可用服务 AHAS 发布重大新特性

福利！阿里宣布手淘安卓客户端容器化框架Atlas正式开源

展开全部

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

429

33

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

291

28

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

129

25

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

140

19

去学习

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

351

9

去学习

大数据实时计算框架Spark快速入门

1038

93

去学习

相关电子书

更多

Hybrid Cloud and Apache Spark 立即下载

Scalable Deep Learning on Spark 立即下载

Comparison of Spark SQL with Hive 立即下载

相关实验场景

更多