备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

当任务出错，出错恢复策略如何解决问题？

当任务出错，出错恢复策略如何解决问题？

展开

收起

詹姆斯邦德00 2021-11-17 17:12:56 1380 0

1 条回答

写回答

取消提交回答

开发者小助手_LS

目前 Flink 默认的 FailoverStrategy 是 RestartPipelinedRegionFailoverStrategy。采用了这个策略后，如果一个 Task 失败了就会重启它所在的 region。这其实跟 Pipelined 数据交换有关系。在 Pipelined 数据交换的节点之间，如果任意一个节点失败了，其相关联的其它节点也会跟着失败。这是为了防止出现数据的不一致。因此为了避免单个 Task 导致多次 Failover，一般的操作是在收到第一个Task failed 时，就把其他的一起 cancel 掉，再一起重启。

RestartPipelinedRegion 策略除了重启失败任务所在的 Region 外，还会重启它的下游Region 。原因是任务的产出很多时候是非确定性的，比如说一个record，分发到下游的第一个并发，重跑一次；分发到下游的第二个并发时，一旦这两个下游在不同 region 中，就可能会导致 record 丢失，甚至产生不一样的数据。为了避免这种情况，采用PipelinedRegionFailoverStrategy 会重启失败任务所在的Region 以及它的所有的下游 Region。

还有一个 RestartAllFailoverStrategy 策略，它会在任意 Task fail 的时候，重启作业中的所有任务。一般情况，这个策略并不被经常用到，但是在一些特殊情况下，比如当任务失败，用户不希望局部运行而是希望所有任务都结束并整体进行恢复，可以用这个策略。

资料来源：《Apache Flink 必知必会》，下载链接：https://developer.aliyun.com/topic/download?id=1189

2021-11-17 19:17:17

赞同展开评论打赏

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

这个怎么修复？执行失败！错误类型：UnhandledInvocationError；

662

1

0

binlog有定期删除，程序有时候找不到binkog了，有什么参数可以解决吗？

634

1

0

因为binlog有定期删除，程序有时候找不到binkog了，有什么参数可以解决吗？

677

2

0

都是执行失败检查了没问题不知道出在哪里？

423

1

0

程序增加了算子，然后从保存点恢复失败了，这个是报错信息，这种情况应该怎么办呢？

374

1

0

怎样能让程序遇见异常的时候自动跳过？

380

1

0

为什么有时候备份任务会失败？

1380

1

0

不使用minibatch时状态丢失的异常，这个是bug吗？

930

1

0

当任务出错，谁来决定哪些任务会受到影响？

1264

1

0

如何检查文件是否存在无异常？如何解决这个问题。

588

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

flinkcdc启动，怎么修改默认端口号，默认是8081。

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink如何配置Task Manager？

大佬有遇见过这个错误的吗？连接kerberos的kafka的时候失败

Flink Job任务设置table.exec.state.ttl = '24h'后，是正常的吗？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

Flink这个未授权访问漏洞有什么解决方案吗？

flink谁遇到过这种问题嘛？怎么解决啊？

各位老师，请教个问题，flink 会在本地 /tmp 目录下产生大量flink-临时文件，目前看好？

展开全部

Flink: 快速构建统一的实时日志平台

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

blink测试技术介绍

Flink 1.10 和 Hive 3.0 性能对比（附 Demo 演示 PPT）

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

资料合集｜Flink Forward Asia 2024 上海站

Fluss：面向实时分析设计的下一代流存储

Flink CDC 在阿里云实时计算Flink版的云上实践

实时计算 Flash – 兼容 Flink 的新一代向量化流计算引擎

Flink CDC+Kafka 加速业务实时化

展开全部

相关电子书

更多

面向失败设计 立即下载

低代码开发师（初级）实战教程 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载