开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

对于Flink CDC,一般不太可能一张的记录数正好是1000的倍数,总有一个余数需要处理?

对于Flink CDC,mysql全量时,当一张表结束后,是否可以通知一下sink,比如发送一个类似EOF的change event到sink端,这样sink就能方便的处理全量数据,因为当sink有多个subtask时,根本不知道snapshot是否已经结束了。一般sink端处理全量都是批量的方式,比如1000条一个批次,如果不知道一张的snapshot已经结束了,那sink端就无法处理缓存中的尾数,一般不太可能一张的记录数正好是1000的倍数,总有一个余数需要处理?

展开
收起
想去床上睡觉 2024-07-03 14:08:39 29 0
1 条回答
写回答
取消 提交回答
  • 增量阶段只有1哥并行度在工作,配置scan.incremental.close-idle-reader.enabled = ‘true‘,全量结束会自动关闭task。
    配置scan.incremental.close-idle-reader.enabled = ‘true‘,全量阶段结束会自动关闭空闲task-此回答整理自钉群“Flink CDC 社区”

    2024-07-03 15:03:08
    赞同 4 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载