文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们我flink yarn-per-job模式任务中间失败了自动重启了重启这段时间的数据丢失了

大佬们我flink yarn-per-job模式任务中间失败了自动重启了重启这段时间的数据丢失了怎么办这种问题如何排查任务失败原因

展开

收起

游客3oewgrzrf6o5c 2022-07-07 14:50:49 835 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，在阿里云Flink中，如果使用yarn-per-job模式运行作业，遇到任务中间失败后自动重启，重启过程中可能会导致部分数据丢失。为了避免数据丢失，可以考虑以下几点：
1. 在Flink应用程序中实现数据恢复机制：通过实现Flink应用程序中的Checkpoint机制和Operator State机制，可以实现数据的自动备份和恢复，避免数据丢失。
2. 配置Flink应用程序的重启策略：可以通过配置Flink应用程序的重启策略，来控制任务在重启时的行为。例如，可以设置最大尝试次数和重试间隔等参数，以避免频繁的重启和数据丢失。
3. 排查任务失败原因：如果任务中间失败后自动重启，可以通过Flink Web UI或日志文件等方式，来查看任务失败的原因和具体的错误信息。常见的任务失败原因包括网络异常、资源不足、代码逻辑错误等，需要根据具体的情况进行排查和修复。
在排查任务失败原因时，可以考虑以下几个方面：
1. 查看Flink应用程序的日志文件，了解任务执行过程中的细节和异常情况。
2. 使用Flink Web UI查看任务的状态和运行情况。
3. 分析任务失败的堆栈信息和错误日志，找出具体的失败原因和异常情况。
4. 调整任务的配置参数，例如并发度、资源分配等，以优化任务的执行效率和稳定性。
需要注意的是，在排查任务失败原因时，需要对Flink应用程序、YARN集群和底层资源等方面都进行细致的分析和排查，以找出具体的问题和解决方案。
2023-07-23 11:28:45

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版模式任务实时计算 Flink版模式实时计算 Flink版重启实时计算 Flink版任务重启

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC中通过yarn-per-job 其他任务都在ACCEPTED状态？

234

0

0

Flink CDC yarn-per 模式提交flink任务，这个是什么情况？

184

3

0

flink on yarn提交任务的时候发生了这个类转换异常的问题，yanr环境是cdh6.3.2？

358

1

0

Flink CDC任务能正常提交到yarn 这个0.0.0.0:8030能用什么参数修正呀？

149

1

0

flink on yarn 集群跑cdc任务突然报这个错误，集群连不上了这是什么问题呢？

209

1

0

如果是采用lfink on yarn模式提交任务，这种那个该如何控制呢？

133

1

0

在Flink CDC中怎么通过yarn-session方式提交yaml的cdc任务？

622

1

0

在Flink CDC中为什么提交的cdc任务无法看到TM的日志，只能通过yarn logs的命令?

190

0

0

在Flink CDC中flink-cdc整库同步任务能不能指定yarn-session的id提交？

167

1

0

flink-cdc-3.0.0 配置的yaml任务，我想提交到yarn集群上执行，怎么自启动？

279

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

Skill即服务：用Agent安全玩转云上Flink

跨境代购集运架构设计｜Taocarts代购系统对接国际集运转运接口实践

大模型应用：从意图识别到个性化推荐：基于语义意图识别的智能推荐系统.121

2026年企业如何建设数据系统？技术选型、流程搭建及风险规避

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

有用flink cdc同步mysql到hive这样搞过的源码吗?

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

如何用实时数据同步打破企业数据孤岛？

这个AI 说的 Flink的每个key状态和每个并行度的状态怎么测试区分？

请问mysql-cdc支持在pyflink中将数据从mysql-cdc输入到doris吗？

Flink CDC2.4.1的版本sqlserver支持指定时间戳消费了吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

展开全部

还有其他疑问?