实时计算 Flink版这个是重试3次就停止哈,失败了4次还没有停止?
Flink中的任务重试次数是由TaskManager设置的,而不是由JobManager设置的。这意味着,即使你的任务失败超过了TaskManager允许的最大重试次数,JobManager也不会立即终止该任务。
默认情况下,TaskManager允许的任务最大重试次数是3次。但是,你可以在Flink的配置文件中修改这个值。你可以在flink-conf.yaml
文件中找到一个名为taskmanager.numberOfTaskRetries
的参数,你可以修改这个参数的值来改变TaskManager允许的最大重试次数。
另外,如果你的任务失败超过了TaskManager允许的最大重试次数,你可以使用Flink的保存点机制来恢复任务。保存点是一种特殊的检查点,它们可以保存任务的当前状态,以便在任务失败后可以从这个状态开始执行。
你这明显是做checkpoint失败了,看你配置也是checkponit超过30ms就不执行,这个点你是需要去优化你的代码。不要做异步,调接口等操作。我刚刚看了一下。flink的配置和操作系统硬件配置也会影响检查点的成功,此回答整理自钉群“【③群】Apache Flink China社区”
实时计算 Flink 版在任务失败时会进行重试,默认情况下会重试3次。如果任务连续失败4次,那么任务将停止运行。但是,如果您的任务配置了重试次数大于3次,那么任务将会继续重试直到达到最大重试次数。此外,您还可以通过设置重试间隔时间来控制任务的重试频率。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。