开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC里看了下mysql的日志,这种效果要怎么实现?

Flink CDC里看了下mysql的日志,发现flink在查询数据的时候,使用的语句是 select from table。我在创建sql任务的时候,source端是列出了要的字段,flink还会用select 去查找库里面查找。因为cdc读取源端数据分两个阶段,第一阶段是做可并行的全量快照(select *),第二阶段做单线程读binlog拿增量数据。我想在第一阶段的时候查询也通过指定字段查询,有方法吗?目前看到源码中是指定好的。使用的是flink1.17.1版本,2.4.1的cdc。自己编译源码修改这块的逻辑就可以了吗?刚接触不久没搞过。会牵扯到其余的大变动吗?8b843c12615e2909fd61834203be6df5.pnge85c80abd98389ec2043733520b4b67d.png

展开
收起
小小鹿鹿鹿 2024-02-14 14:52:17 60 0
1 条回答
写回答
取消 提交回答
  • 理论上是可以的,需要自己修改下代码逻辑。我理解如果不涉及到 DDL 同步,改动不是很大,每次解析数据时候处理下。此回答来自钉群Flink CDC 社区。

    2024-02-14 15:24:39
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    PostgresChina2018_赖思超_PostgreSQL10_hash索引的WAL日志修改版final 立即下载
    Kubernetes下日志实时采集、存储与计算实践 立即下载
    日志数据采集与分析对接 立即下载

    相关镜像