开发者社区> 问答> 正文

如何实现 Flink CDC 中全量和增量日志的并行读取?

如何实现 Flink CDC 中全量和增量日志的并行读取?

展开
收起
花开富贵111 2024-08-19 11:35:46 63 0
1 条回答
写回答
取消 提交回答
  • 为了实现全量和增量日志的并行读取,我们对 Flink CDC 进行了拓展。在程序启动时,Enumerator 会首先创建 BinlogSplit 并放在分配列表的首位,用于执行增量数据采集。同时,Enumerator 也会将全量数据采集任务切分成多个 SnapshotSplit 并分配给 SourceReader 执行。这样,全量和增量日志就可以并行读取了。新增表后,通过恢复任务和对比用户配置与状态信息,可以捕获到新表并为其添加相应的全量和增量数据采集任务。image.png
    image.png

    2024-08-19 16:15:50
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载