备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink 在任务执行前我也不知道这个任务需要多少的内存，这个有什么解决方法吗?

Flink on yarn任务在执行的时候数据量太大容易jobmanager或者taskmanager内存不足，然后容器直接被kill掉，在任务执行前我也不知道这个任务需要多少的内存，这个有什么解决方法吗?

展开

收起

真的很搞笑 2023-11-30 13:07:14 61 0

2 条回答

写回答

取消提交回答

芯在这

先按集群资源算算按cpu和内存配比给，然后报溢出了再加，从ck恢复就行，此回答整理自钉群“【③群】Apache Flink China社区”

2023-11-30 21:43:20

赞同展开评论打赏
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
当 Flink 在 YARN 上运行时，由于数据量大而导致 JobManager 或 TaskManager 内存不足的情况是很常见的。以下是一些解决此类问题的方法：
1. 增加资源：
  
  增加每个 TaskManager 的内存大小：通过 yarn.application-master.vcores 和 yarn.container-vcores 设置来调整分配给任务的 CPU 核心数。
  增加 TaskManager 的数量：在提交作业时指定更多的并行度（如使用 -yn 参数）。
2. 监控和调优：
  
  使用 Flink Web UI 监控作业状态，包括 TaskManager 的资源使用情况、水位线等指标。
  调整 checkpoint 间隔和超时时间，以降低系统开销。
3. 优化数据处理逻辑：
  
  减少 state 的使用，或者使用更高效的状态存储方式（如 RocksDB）。
  对于高并发的数据流，考虑使用分桶、分区等技术来分散数据负载。
4. 预估资源需求：
  
  在实际部署前进行测试，根据测试结果估计所需资源。
  可以使用一些工具（如 Apache JMeter 等）模拟生产环境中的数据流量，以此来预估资源需求。
5. 动态资源调整：
  
  使用 Flink 自带的 dynamic scaling 功能，在作业运行过程中动态地添加或减少 TaskManagers。
  配合 YARN 的动态资源调整功能，自动扩展集群规模。
6. 使用外部持久化存储：
  
  如果可能，将部分计算过程产生的中间数据保存到外部持久化存储（如 HDFS），而不是全部保留在内存中。
7. 升级硬件：
  
  如果当前硬件资源不足以应对大数据量的处理，可以考虑升级服务器的硬件配置。
8. 使用高效的序列化库：
  
  使用高效的序列化库（如 Protobuf、Kryo 等）来降低数据传输和存储的成本。
2023-11-30 13:17:17

赞同展开评论打赏

问答分类：

流计算容器资源调度实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版内存任务内存内存解决方法实时计算 Flink版任务内存

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关产品：

实时计算 Flink版

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Flink中流任务和批任务内存申请是如何进行的

42

1

0

应用实时监控服务创建内存快照一直显示任务已发布

38

1

0

可观测体系能监控DTS数据同步任务和ClickHouse的内存使用预警吗？

34

0

0

如何使用阿里云监控平台确保DTS数据同步任务和ClickHouse集群的稳定运行与资源管理？

55

0

0

在Flink任务失败自动无状态重启为什么会偶尔导致内存不足呢？

59

1

0

DataWorks提交任务到 emr 集群跑的时候，在哪里可以设置内存资源？

94

13

0

modelscope-funasr内存一直增加的问题有什么好解决方法么？

58

0

0

flink报错给的解决方法是这个，但是rds又不支持设置这几个参数该怎么办啊？

51

0

0

Flink CDC中 sql server 部分最近发现一个问题，还有别的解决方法么？

33

0

0

DataWorks运行任务报以下错误，能通过调整第二图里面执行命令的内存和cpu 来解决吗？

47

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关产品

实时计算 Flink版

文档详情产品详情

热门讨论

热门文章

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

Flink如何配置Task Manager？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flinkcdc启动，怎么修改默认端口号，默认是8081。

flink谁遇到过这种问题嘛？怎么解决啊？

各位老师谁有flinkcdc 到gaussdb的实践案例？有相关连接器吗

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

请问flink-connector-jdbc在sink时，如何设置批量写入？

Flink Job任务设置table.exec.state.ttl = '24h'后，是正常的吗？

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

展开全部

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

一文带你了解 Flink Forward 柏林站全部重点内容

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

资料合集｜Flink Forward Asia 2024 上海站

Fluss：面向实时分析设计的下一代流存储

Flink CDC 在阿里云实时计算Flink版的云上实践

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

Flink CDC 3.0 正式发布，详细解读新一代实时数据集成框架

Flink CDC+Kafka 加速业务实时化

Flink 四大基石之 Checkpoint 使用详解

展开全部

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

611

29

去学习

Apache Flink 入门到实战 - Flink开源社区出品

1659

16

去学习

实时计算 Flink 版产品入门与实操

4040

10

去学习

开源 Flink 极速上手教程

1884

7

去学习

大数据实时计算框架Spark快速入门

1035

93

去学习

Apache Flink 入门

5151

9

去学习

相关电子书

更多

Flink峰会 - 李佳林 立即下载

内存取证与IaaS云平台恶意行为的安全监控 立即下载

云服务器ECS内存增强型实例re6全新发布 立即下载

相关实验场景

更多