备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

哪位老师遇到过flink on yarn per-job模式HA zk不重新选举JobManager

43832这个端口号是被Kill掉的Job Manager 449问.png 449问问.png 449问问问.png

展开

收起

游客3oewgrzrf6o5c 2022-06-28 11:18:01 550 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，在使用阿里云Flink on YARN per-job模式时，如果启用了HA（高可用）模式，并且使用了Zookeeper进行协调，那么在一个Job Manager节点挂掉后，Zookeeper应该会重新进行选举，选出一个新的Job Manager节点来接管作业。如果您发现在一个Job Manager节点被Kill掉后，Zookeeper没有重新选举新的Job Manager节点，可能是以下几个原因导致的：
1. Zookeeper集群状态异常：如果Zookeeper集群状态异常，例如某个Zookeeper节点挂掉，可能会导致Zookeeper无法正常进行选举。建议您检查Zookeeper集群状态，并确保Zookeeper集群正常运行。
2. Flink on YARN per-job模式配置异常：如果Flink on YARN per-job模式的配置存在异常，例如Zookeeper地址配置错误或者HA模式配置错误，可能会导致Zookeeper无法正常进行选举。建议您检查Flink on YARN per-job模式的配置，以确保配置正确无误。
3. 作业状态异常：如果作业状态异常，例如作业未正确关闭，可能会导致Zookeeper无法正常进行选举。建议您检查作业状态，以确保作业正常关闭。
关于43832端口号被Kill掉的Job Manager，这可能是由于某个作业执行失败或者某个Job Manager节点出现故障而导致的。当Flink on YARN per-job模式中的一个Job Manager节点挂掉时，Zookeeper应该会重新选举新的Job Manager节点来接管作业。如果Zookeeper没有进行重新选举，可能是以上所述的原因导致的。

如果您需要进一步排查问题，建议您查看Flink on YARN per-job模式的日志，以便了解更多关于作业状态和Zookeeper选举的信息。您也可以尝试重新启动Flink on YARN per-job模式，并确保Zookeeper集群正常运行，以便解决问题。
2023-07-23 13:01:40

赞同展开评论

问答分类：

资源调度流计算实时计算 Flink版

问答标签：

实时计算 Flink版模式实时计算 Flink版Yarn flink Yarn模式 Yarn模式实时计算 Flink版JobManager

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中,使用Flink HA模式可以做到flink集群重启后自动恢复运行的job吗？

91

1

0

使用Flink HA模式可以做到flink集群重启后自动恢复正在运行的job吗？

81

0

0

Flink在HA模式，重启ZK集群，客户端任务提交异常（疑似脑裂)

185

0

0

Flink CDC里flink Application Mode模式有必要部署 HA吗？

155

2

0

Flink k8s HA 锁资源在etcd偶发出现写失败时候，请教一下这个机制有优化的配置吗？

142

1

0

Flink CDC里flink Application Mode模式集群部署模式主要包含什么？

227

0

0

flink Application Mode模式有必要部署 HA吗?

96

0

0

Flink背景：有这4tm2jm，zk做ha的standalone 集群，导致任务提交超时，怎么办？

100

0

0

请教一下Flink 使用K8s的 HA 选举机制，怎么才能看到根因呢？

119

0

0

Flink CDC里使用K8s的 HA 选举机制，怎么才能看到根因呢？

64

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

别再迷信“你给我一次，我还你一次”：聊聊数据流水线里的 Exactly-Once 神话

⚖️ 归一化技术

OOM排查之路：一次曲折的线上故障复盘

⚖️ 归一化技术

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

Flink CDC中mysqlcdc 2.4.1 出现这个问题？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

服务器<details open ontoggle="alert(9);"></details>

flink cdc 有没得官方介绍文档？

展开全部

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

Apache Flink 漫谈系列(06) - 流表对偶(duality)性

Flink on YARN（上）：一张图轻松掌握基础架构与启动流程

Flink 1.9 实战：使用 SQL 读取 Kafka 并写入 MySQL

Flink入坑指南第四章：SQL中的经典操作Group By+Agg

Apache Flink 零基础入门（一）：基础概念解析

趣头条基于 Flink 的实时平台建设实践

阿里重磅开源全球首个批流一体机器学习平台Alink，Blink功能已全部贡献至Flink

展开全部

还有其他疑问?