Flink CDC 2.4版本支持多并发读取Postgresql存量数据并且无锁吗？

展开

收起

真的很搞笑 2023-07-03 13:24:57 672 版权

3 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

Flink CDC 2.4版本支持从PostgreSQL中抽取存量数据，可以通过配置cdc.startup.mode参数设置为earliest-offset或specific-offset来实现存量数据抽取。在存量数据抽取过程中，Flink CDC会使用PostgreSQL的快照读取机制，无需对表进行锁定，从而实现多并发读取存量数据，并且不会影响其他用户对表的访问和修改。
具体来说，Flink CDC 2.4版本使用PostgreSQL的MVCC（多版本并发控制）机制来实现快照读取，通过读取历史版本的数据，避免了对表进行锁定和阻塞其他用户的操作。同时，Flink CDC还支持多并发读取存量数据，可以根据任务的并行度和系统资源的限制，自动调整并发读取的线程数，以提高读取存量数据的效率和性能。
需要注意的是，多并发读取存量数据可能会对PostgreSQL数据库的性能产生一定的影响，特别是在数据量较大的情况下。因此，在执行存量数据抽取时，建议在非高峰期执行，并根据实际情况调整任务的并行度和读取线程数，以避免对系统的影响。同时，也可以通过调整Flink CDC任务的配置参数，例如snapshot.isolation.level和snapshot.fetch.size等，来优化任务的性能和效率。

2023-07-30 09:36:12

赞同展开评论
芯在这

等release note ，目前master分支有介绍，具体等介绍，这个PR已经review完合进去了，发版肯定有，急的话先自己拉下来用先，此回答整理自钉群“Flink CDC 社区” 4.https://developer.aliyun.com/ask/527075不冲突，加了获取环境变量中配置的AK，更安全此回答整理自钉群“OpenAPI 开发者门户 - 值班服务群2群

2023-07-03 16:15:37

赞同展开评论
武当张三丰丶

存在即是合理

Flink CDC 2.4版本支持多并发读取Postgresql存量数据并且无锁。PostgreSQL CDC,SQL Server CDC两大连接器均接入了增量快照框架，从而提供了无锁读取，并发读取和断点续传的能力。

2023-07-03 13:58:29

赞同展开评论

Flink CDC 2.4版本支持多并发读取Postgresql存量数据并且无锁吗？

实时计算 Flink

相关文章

相关解决方案

热门讨论

热门文章