备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink如果我配置了最大连续失败数不为 1 那么如果我 ck 失败了我这批数据会丢失吗？

Flink中kafka 的精准一次 sink 如果我配置了最大连续失败数不为 1 那么如果我 ck 失败了我这批数据会丢失吗？

展开

收起

真的很搞笑 2024-01-09 12:26:30 78 0

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

如果你配置了最大连续失败数不为1，那么在Flink中Kafka的精准一次sink中，如果ck失败了，这批数据不会丢失。因为最大连续失败数表示允许的最大连续失败次数，超过这个次数后，Flink会将这批数据进行重试。所以，只要重试次数没有达到最大连续失败数，这批数据就不会丢失。

2024-01-09 14:27:42

赞同展开评论打赏
1941623231718325
在 Apache Flink 中，如果配置了 Kafka sink 的最大连续失败次数（max.retries 或 max-concurrent-sink-failures）不为 1，意味着当sink 连续失败达到该配置值之前，Flink 将尝试重新提交并处理数据。每次重试时，Flink 都会依赖其 checkpoint 和状态管理机制来确保至少一次或精准一次的语义。

对于 checkpointing 与 Kafka sink 结合使用的情况：
- 至少一次语义：即使 sink 失败并进行了重试，由于 checkpoint 的存在，Flink 至少能保证每个记录会被成功写入到 Kafka 一次，但可能由于重试导致数据重复。
- 精准一次语义：若要实现精准一次（exactly-once），通常需要配合两阶段提交（two-phase commit protocol）。在 Flink 中，这涉及到和 Kafka transactional producer 结合使用，并且要求整个任务的故障恢复流程能够正确地协调检查点和事务边界。
当你配置了非严格的最大连续失败数（即大于1），在出现 Checkpoint (CK) 失败的情况下，Flink 作业会根据设定的策略进行重试，只要不超过最大连续失败次数限制，并且能够在后续重试中成功完成checkpoint，则不会丢失数据。

然而，如果所有重试均失败，并且达到了最大连续失败次数，则这批数据可能会丢失（取决于你是否启用其他的备份机制，如 side output 或死信队列等）。此外，在精准一次语义下，即便没有达到最大连续失败次数，如果因为某些原因无法正常完成事务提交，也可能导致数据最终未被确认写入Kafka。
2024-01-09 13:59:25

赞同 1 展开评论打赏

问答分类：

流计算消息中间件 Kafka 实时计算 Flink版云数据库 ClickHouse 云消息队列 Kafka 版

问答标签：

实时计算 Flink版数据实时计算 Flink版配置云数据库 ClickHouse数据云数据库 ClickHouse flink 云数据库 ClickHouse配置

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关产品：

实时计算 Flink版

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

如何在Clickhouse中将一个表的数据分组并同步到另一张表中

253

1

0

dataworks 新增ClickHouse数据源时，地址是需要配置多个地址，如何配置呢？

60

1

0

DataWorks中mc同步到clickhouse的数据怎么办？

45

1

0

有flink CDC 同步mysql到clickhouse的案例吗？

81

0

0

flink CDC能从mysql同步到clickhouse吗？

136

1

0

在Flink CDC中flink-cdc没有抛出异常，而且ck一直成功，这个是正常现象吗？

80

8

0

Flink clickhouse元数据管理不支持吗

51

1

0

ClickHouse rds同步数据出现遗漏

54

1

0

Maxcompute数据表中的数据能否导入到自建的ClickHouse中

55

1

0

用Flink CDC做Oracle到ClickHouse的同步，能做到秒级同步吗？

80

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关产品

实时计算 Flink版

文档详情产品详情

热门讨论

热门文章

Flink mysql cdc全量阶段现在支持select *字段自定义吗？

web-ui 加载会非常慢是什么原因呢？

FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？

使用flink on yarn的模式，怎么进行内存资源调优呢，如何配置flink内存

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

百问求答（17）Flink 问题专场！回答问题赢小米电动牙刷等好礼

flink本地启动webUI，TaskManager的Logs日志可以正常查看怎么办？

有遇到过flink 一直重启的问题么？

请问flink-connector-jdbc在sink时，如何设置批量写入？

Flink CDC-sql怎样导数据使starrocks支持主键模型delete的配置吗？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

基于实时计算（Flink）打造一个简单的实时推荐系统

广告场景下的实时计算

如何正确使用 Flink Connector？

Flink SQL 功能解密系列 —— 数据去重的技巧和思考

展开全部

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

611

29

去学习

Apache Flink 入门到实战 - Flink开源社区出品

1666

16

去学习

实时计算 Flink 版产品入门与实操

4045

10

去学习

开源 Flink 极速上手教程

1885

7

去学习

大数据实时计算框架Spark快速入门

1038

93

去学习

Apache Flink 入门

5156

9

去学习

相关电子书

更多

Flink CDC Meetup PPT - 龚中强 立即下载

Flink CDC Meetup PPT - 王赫 立即下载

Flink CDC Meetup PPT - 覃立辉 立即下载

相关实验场景

更多