Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，有什么建议？

Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，在观察中。有没有大佬有什么建议？

展开

收起

真的很搞笑 2023-11-22 06:52:05 460 版权

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
如果你遇到的是 Flink CDC 全量同步阶段出现频繁 full gc 的问题，并且已经尝试过增加 heartbeat timeout 参数来解决，那么我建议您继续检查以下几个方面：
- 检查作业的资源需求，例如 CPU 和内存资源是否充足。如果作业规模较大，可能需要增加 JM（Job Manager）的 CPU 和内存资源。
- 调整 akka.ask.timeout 和 heartbeat.timeout 参数取值。这两个参数的默认值为 50 秒，如果您遇到的是大规模作业，可以考虑增大它们的值。但是，请注意这仅适用于大规模作业，不要随意在其他情况下调整这些参数。
- 如果上述方法仍然无法解决问题，请考虑查看 Flink 社区的相关讨论或寻求专业人员的帮助。
2023-11-29 15:46:29

赞同展开评论
芯在这

高可用搞起来，此回答整理自钉群“Flink CDC 社区”

2023-11-22 10:40:24

赞同展开评论
sunrr
对于Flink CDC频繁出现fullgc的问题，您可以尝试以下方法：
1. 调整心跳超时时间：增加Flink配置文件中的heartbeat.timeout参数的值可以延长心跳超时时间。例如，可以将这个值从默认的1分钟增加到2分钟或更长，以允许任务管理器在更长的时间内发送心跳信号。
2. 检查网络连接：确保任务管理器和JobManager之间的网络连接正常，没有防火墙或其他网络配置导致的阻塞。
3. 增加任务管理器资源：如果任务管理器资源不足，可能会导致无法及时发送心跳信号。可以考虑增加任务管理器的资源，如内存或CPU核心数，以提高其处理能力。
4. 优化Flink作业：根据具体的业务场景和数据量情况，对Flink作业进行优化，例如调整并行度、减少状态存储等。
5. 监控和定位问题：持续监控Flink作业的状态和性能指标，如GC频率、内存使用率等。如果发现异常情况，可以通过分析日志和指标信息来定位问题的根本原因。
2023-11-22 10:32:37

赞同展开评论

Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，有什么建议？

实时计算 Flink

相关文章

热门讨论

热门文章