文档备案控制台

开发者社区问答正文

Flink 中的分布式快照机制是如何实现的呀？

Flink 中的分布式快照机制是如何实现的呀？

展开

收起

游客5ixw6pdymb5xs 2021-12-08 13:56:42 665 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客adifubdl4lvhs

Flink的容错机制的核心部分是制作分布式数据流和操作算子状态的一致性快照。这些快照充当一致性checkpoint，系统可以在发生故障时回滚。 Flink用于制作这些快照的机制在“分布式数据流的轻量级异步快照”中进行了描述。它受到分布式快照的标准Chandy-Lamport算法的启发，专门针对Flink的执行模型而定制。

barriers在数据流源处被注入并行数据流中。快照n的barriers被插入的位置（我们称之为Sn）是快照所包含的数据在数据源中最大位置。例如，在Apache Kafka中，此位置将是分区中最后一条记录的偏移量。将该位置Sn报告给checkpoint协调器（Flink的JobManager）。

然后barriers向下游流动。当一个中间操作算子从其所有输入流中收到快照n的barriers时，它会为快照n发出barriers进入其所有输出流中。一旦sink操作算子（流式DAG的末端）从其所有输入流接收到barriers n，它就向checkpoint协调器确认快照n完成。在所有sink确认快照后，意味快照着已完成。

一旦完成快照n，job将永远不再向数据源请求Sn之前的记录，因为此时这些记录（及其后续记录）将已经通过整个数据流拓扑，也即是已经被处理结束。

2021-12-08 13:57:28

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版分布式 flink分布式实时计算 Flink版快照分布式flink 实时计算 Flink版机制

问答地址：

开发者社区 > 大数据 > 问答

相关问答

分布式锁提供Fencing保护的核心机制是什么？

149

1

0

分布式锁的内部实现机制是怎样的？

93

1

0

简述 PolarDB-X 实现分布式事务全局一致性和快照隔离的流程？

187

1

0

flink-cdc支持 postgre的增量快照吗？

204

1

0

在 Flink 机制中，DFS 如何帮助实现 DSTL 的短期持久化和一致性保证？

164

1

0

Flink中通过MQ的连接器消费数据时有确认机制吗？

324

2

0

Flink CDC 2.2 版本支持哪些新数据源，兼容哪些 Flink 版本，提供了什么增量快照读取

314

1

0

为什么选择使用基于zk的分布式锁替换Hive Metastore的默认锁机制？

154

1

0

在Flink CDC中，快照阶段也需要记录binlog的？

215

1

0

在Flink CDC中增量快照阶段checkpoint失败有啥排查方式吗？

304

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云邮箱个人版登录入口链接在哪？

开阿里云服务器多少钱一个？带你了解不同类型的服务器价格

在 IDEA 中使用通义灵码自动修改代码时，IDEA 报错

通义灵码的 idea 插件，版本2.11.3，在idea 2026.1下，点击代码应用按钮报错

太糟糕了 Lingma

相关文章

Skill即服务：用Agent安全玩转云上Flink

跨境代购集运架构设计｜Taocarts代购系统对接国际集运转运接口实践

大模型应用：从意图识别到个性化推荐：基于语义意图识别的智能推荐系统.121

2026年企业如何建设数据系统？技术选型、流程搭建及风险规避

还有其他疑问?