开发者社区> 问答> 正文

flink sql cdc并行度怎么做?

flink sql作业:消费mysql binlog将数据同步到 mongodb 问题: 1. mysql-cdc connector只能设置成一个并行度吗? 2. 可以增大mongodb的sink并行度吗?可以的话,要如何设置?它保证主键相同的记录会发到同一个分区sink吗?*来自志愿者整理的flink邮件归档

展开
收起
EXCEED 2021-12-01 16:51:11 2880 0
1 条回答
写回答
取消 提交回答
  • mysql-cdc connector只能设置一个并行度,主要可能有这些原因:

    1. mysql binlog本质上是一个文件,多个并行度消费需要避免重复

    2. 多个并行度消费难以保证顺序

    sink可以设为多个并行度,但是顺序不一定,如果需要主键相同的记录发到同一个sink线程可以先做一个keyby,并且保证keyby并行度与sink并行度相同,这样基本上能够保证数据forward传输,不过也不能100%保证有序。

    如果需要保证有序还是建议sink并行度为1

    *来自志愿者整理的flink邮件归档

    2021-12-01 17:01:33
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载