备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC中世界是 20多万的数据，为啥落库的时候只有 10多万？

"Flink CDC中世界是 20多万的数据，为啥落库的时候只有 10多万？

批任务，我使用mysql 查询的数量都一致的，就是 flink 落库的时候不对。简单的etl 使用sql ，但是测试还是有问题。

flink 说的是流批一体，不想弄那么中间件。
"

展开

收起

十一0204 2023-08-09 08:55:42 75 0

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

如果在使用 Flink CDC 进行数据同步时，源数据有 20 多万条记录，但最终只有 10 多万条记录被成功写入目标数据库，可能有以下几个可能的原因：

过滤条件：检查你的 Flink CDC 应用程序是否设置了过滤条件，导致某些记录被过滤掉而没有写入目标数据库。确保过滤条件正确设置，以便包含所有需要同步的数据。

数据源问题：检查源数据的完整性和准确性。可能是源数据中存在重复记录、缺失记录或其他数据问题导致最终写入目标数据库的记录数量不符合预期。

数据转换或处理错误：如果你在 Flink CDC 应用程序中对数据进行了转换或处理操作，错误的处理逻辑可能导致数据丢失或数量减少。检查你的数据转换或处理逻辑，确保它们正确地处理源数据并生成正确的目标数据。

数据写入失败：在数据写入目标数据库时，可能发生写入失败的情况。这可能是由于数据库连接问题、目标表定义不匹配或其他写入错误导致的。检查你的目标数据库的配置和表定义，确保它们与写入操作相匹配，并查看日志或错误信息以获取更多关于写入失败的信息。

并发或同步延迟：如果你的 Flink CDC 应用程序使用并发处理或存在同步延迟，可能会导致最终写入目标数据库的记录数量不符合预期。在这种情况下，你可以调整并发度或处理延迟的配置，以满足你的需求。

2023-08-13 16:57:14

赞同展开评论打赏

问答分类：

SQL 中间件关系型数据库 MySQL 流计算实时计算 Flink版云数据库 RDS MySQL 版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版cdc数据库实时计算 Flink版数据实时计算 Flink版cdc数据实时计算 Flink版cdc库

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关产品：

实时计算 Flink版

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

Flink CDC 里mysql->Doris的整库同步，没有成功自动建表以及同步数据？

296

1

0

大家有没有使用flink cdc 3版本来全库同步mysql到doris或者sr？

46

0

0

在Flink CDC中，不明白的是测试环境测试库是正常的，生产环境上会报这个错误？

23

0

0

Flink mysql的5.6版本的备库不支持做增量的实时同步么？

22

0

0

在Flink CDC中MySQL 整库同步 Kafka，不支持动态加表功能吗？

51

1

0

Flink多表不是我想的那种多个 create 的方式吗？好像是同步整库，然后在库里面选表吗？

49

1

0

对于Flink CDC，region_id这个字段源库有NULL值，会不会是这个原因？

25

1

0

在Flink CDC中mysql ds 整库监控的话需要这个库下面的表都必须得有主键吗？

37

0

0

在Flink CDC中新版的3.1在整库同步到starrocks的时候，不会自动建表吗？

28

0

0

flink sql实现整库同步目前只能依赖dinky组件吗？

88

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关产品

实时计算 Flink版

文档详情产品详情

热门讨论

热门文章

FFA 2024 大会门票免费送！AI时代下大数据技术未来路在何方？

大佬，Caused by: java.lang.ClassNotFoundException: or

Slot request bulk is not fulfillable，20以上job同时部署失败

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Caused by: org.apache.kafka.common.errors.TimeoutE

Flink如何配置Task Manager？

使用flink on yarn的模式，怎么进行内存资源调优呢，如何配置flink内存

请问如何用flink sql客户端用yarn application模式提交任务呢？

各位老师，请教个问题，flink 会在本地 /tmp 目录下产生大量flink-临时文件，目前看好？

不同版本的 flink 如何适配不同版本 kafka，flink-connect-kafka 版本

展开全部

权威详解 | 阿里新一代实时计算引擎 Blink，每秒支持数十亿次计算

OPPO数据中台之基石：基于Flink SQL构建实数据仓库

实时计算 Flink SQL 核心功能解密

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

流计算StreamCompute

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

展开全部

相关课程

更多

实时计算 Flink 版产品入门与实操

4018

10

去学习

开源 Flink 极速上手教程

1861

7

去学习

大数据实时计算框架Spark快速入门

1020

93

去学习

Apache Flink 入门

5117

9

去学习

相关电子书

更多

Flink CDC Meetup PPT - 龚中强 立即下载

Flink CDC Meetup PPT - 王赫 立即下载

Flink CDC Meetup PPT - 覃立辉 立即下载

相关实验场景

更多