Spark的搜索结果_第16页-阿里云开发者社区

大家好，我是V哥。在实际业务中，Spark任务常因数据量过大、资源分配不合理或代码瓶颈导致OOM（Out of Memory）。本文详细分析了各种业务场景下的OOM原因，并提供了优化方案，包括调整Executor内存和CPU资源、优化内存管理策略、数据切分及减少宽依赖等。通过综合运用这些方法，可有效解决Spark任务中的OOM问题。关注威哥爱编程，让编码更顺畅！

# 存储 # 缓存 # 分布式计算 # 大数据 # Spark

灵杰开发者

|

博文

|

来自：大数据与机器学习

云栖实录 | 开源大数据全面升级：Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展

在2024云栖大会开源大数据专场上，阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash，该引擎100%兼容Apache Flink标准，性能提升5-10倍，助力企业降本增效。此外，EMR Serverless Spark产品启动商业化，提供全托管Serverless服务，性能提升300%，并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行，欢迎报名参加。

# 云原生数据仓库AnalyticDB MySQL版 # 函数计算 # 云原生大数据计算服务 MaxCompute # 实时计算 Flink版 # 分布式计算 # 大数据 # Serverless # 流计算 # Spark

小Lee

|

博文

大数据学习

【10月更文挑战第2天】大数据学习

# 云原生大数据计算服务 MaxCompute # 分布式计算 # 大数据 # Hadoop # Apache # Spark

刘大猫.

|

博文

Linux环境下 java程序提交spark任务到Yarn报错

# 云消息队列 Kafka 版 # 消息中间件 # 分布式计算 # Java # Kafka # Spark

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Spark