备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

FlinkPostgreCDC同步数据存在乱序的问题

问题1：本地java测试中，增量同步数据，在源表存在频繁的进行插入1删除1，插入2删除2... 等操作时，存在乱序的现象，偶现删除1插入1的问题。起初怀疑是sink处理时的问题，在sink中加入了锁，但是问题还在。目前没有任何头绪解决这个问题。

问题2：在断掉上一次的同步时，偶现会出现replication_slots中的active false、true、false、true。pid一直在变，后台一直在同步重复的数据。

展开

收起

游客nthvlq3v2eofc 2023-06-28 20:18:38 142 0

1 条回答

写回答

取消提交回答

游客mahexp74d6pzw

针对问题1，乱序同步数据的问题可能是由于数据源的操作频率过高，导致数据在同步过程中出现紊乱。在Sink处理中加入锁可以减少并发冲突，但可能无法完全解决这个问题。以下是一些可能的解决方案：

增加数据源操作的锁机制：在源表进行插入和删除操作时，使用更细粒度的锁机制，确保操作顺序一致。例如，对于插入和删除操作，可以使用行级锁或记录级锁来确保操作的原子性。优化数据源操作频率：通过合理控制数据源的操作频率，减少插入和删除操作的并发冲突。例如，可以通过批量操作或定时操作来减少操作次数。使用事务来保证数据一致性：对于插入和删除操作，可以使用事务来保证数据的一致性。在事务中执行插入和删除操作，可以确保操作的顺序和完整性。针对问题2，断点续传后出现重复数据的问题可能是由于同步过程中出现了异常或中断，导致同步重新开始时重复同步了已有的数据。以下是一些可能的解决方案：

使用唯一标识符：在同步过程中，为每条数据添加一个唯一标识符，重复的数据可以识别并排除。使用时间戳：为每条数据添加一个时间戳，新旧数据可以通过时间戳来判断并排除重复数据。使用增量同步：采用增量同步方式，只同步变化的数据，避免重复同步已有数据。优化同步流程：在同步过程中，优化同步流程，减少异常和中断的发生。例如，使用可靠的传输协议，保证网络连接的稳定性等。

2023-06-29 08:08:47

赞同 2 展开评论打赏

问答分类：

Java 实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

this xml file does not appear to have any style in

36346

9

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

236513

10

0

OSS的endpoint如何查看

30764

3

0

有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎？

96465

16

0

如果购买了域名，一定要备案才能用吗

38713

36

0

com/action/joingroup?code=v1是什么意思

208913

20

0

互联网信息服务增值电信业务经营许可证申请资料

6544

2

0

企业邮箱

9266

7

0

什么是红帽认证？

3208

1

0

域名申请

5078

3

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

web-ui 加载会非常慢是什么原因呢？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

flink cdc 有没得官方介绍文档？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink 集群重启后，所有的Jobs任务全都没有了。如果快速恢复所有的任务

flink 启动时报错怎么解决？

有人用minio作为statebackend吗？flink-conf.yml怎么配置的？

阿里云实时计算的资源单位是什么？

flink任务报错: Job leader for job id 是啥原因导致的呢?

请问如何用flink sql客户端用yarn application模式提交任务呢？

展开全部

流计算StreamCompute

接着！！Apache Flink 全领域干货合集（持续更新）

基于Flink的实时日志分析系统实践

运维场景下的实时计算应用

【对话科技】Flink技术介绍和新功能展望

Flink: 实时规则引擎助力新零售发展

Apache Flink 进阶（五）：数据类型和序列化

Flink on YARN（下）：常见问题与排查思路

重磅揭晓！Flink Forward Asia 2019 议程完整出炉

Apache Flink 漫谈系列(12) - Time Interval(Time-windowed) JOIN

展开全部

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载