备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flink - sink - mysql，commit阶段失败了，那这数据是什么状态？我的理解，正常

flink - sink - mysql，commit阶段失败了，那这数据是什么状态？我的理解，正常jdbc开启事务，如果抛异常失败的话那这条数据就丢失了，因为只有checkpoint触发后才会提交事务的，offset在什么时候保存的呢，kafka(source) -> flink -> (sink)mysql

展开

收起

真的很搞笑 2023-08-01 12:59:36 278 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

异常了抛出去然后异常任务恢复重启吧，抛异常失败，flink不报错？是否对异常捕获，继续让程序running，还是只是打印日志，在 Flink 中，Two-Phase Commit Sink Function 是一种用于实现 Exactly-Once 语义的协议。它通过两个阶段的提交来保证事务的一致性和可靠性。

在 Two-Phase Commit Sink Function 协议中，每次数据更新并不会直接更新偏移量。相反，它遵循以下步骤：

预提交阶段（Pre-commit Phase）：当 Flink Sink Function 收到要写入下游系统（如数据库）的数据时，会将数据暂时缓存在内部状态中，同时生成一个与该事务相关的偏移量。在预提交阶段，偏移量并不会被更新。

提交阶段（Commit Phase）：在 Flink Job 完成检查点（Checkpoint）时，Flink 会触发 Two-Phase Commit Sink Function 的提交阶段。在这个阶段，Sink Function 会将之前预提交的数据写入下游系统，并在写入成功后更新偏移量，表示该事务已经成功提交。

通过此协议，偏移量的更新仅在提交阶段完成时进行。这样做的好处是能够确保在发生故障或失败时，Flink 可以通过重新执行两阶段提交协议来保证事务的一致性。如果在预提交阶段或提交阶段失败，Flink 可以借助检查点机制来自动恢复到一致状态，并重新提交失败的事务。

需要注意的是，Two-Phase Commit Sink Function 需要 Sink Function 和下游系统（如数据库）的支持，下游系统需要提供事务性写入的能力，并且 Two-Phase Commit Sink Function 本身也需要能够与下游系统进行交互来实现两阶段提交协议。

总结起来，使用 Two-Phase Commit Sink Function 协议时，偏移量的更新是在事务成功提交后进行的，以确保事务的一致性和可靠性。，此回答整理自钉群“Flink CDC 社区”

2023-08-01 13:03:31

赞同展开评论

问答分类：

消息中间件关系型数据库 MySQL Java Kafka 数据库连接流计算实时计算 Flink版云数据库 RDS MySQL 版云消息队列 Kafka 版

问答标签：

云数据库 RDS MySQL 版数据实时计算 Flink版数据 flink云数据库 RDS MySQL 版实时计算 Flink版mysql 实时计算 Flink版mysql数据

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink1.19还没适配es，要么等，要么自己写connect，然后commit怎么办？

157

0

0

表格存储 mysql数据同步到ots时，每次都丢失2条记录。排查发现，全量同步时commit.？

154

2

0

Flink有用jdbcsink向phoenix插入数据的吗,怎么设置自动commit？

956

1

0

请问一个在flink官网下载的flink执行包，怎么看这个包产出时候的git commit ID呀？

489

2

0

在从mysql合宽表（left join）到iceberg的时候，iceberg commit 记录

404

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2134

1

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1318

2

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

2000

3

0

请教下有flink cdc 对接mysql5.6的demo么？我这边显示各种包错误

1196

4

0

大佬们，按照这个文档说的，如果我想用flink14得用 cdc2.2？用cdc2.2 mysql版

388

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Docker安装Mysql

Activity代码实现

Docker发布微服务

24优雅启动：如何避免流量打到没有启动完成的节点？

common-lang3

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

服务器<details open ontoggle="alert(9);"></details>

Flink CDC中mysqlcdc 2.4.1 出现这个问题？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

flink cdc 有没得官方介绍文档？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

展开全部

还有其他疑问?