开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flink怎么判断全量已经跑完了,开始走增量的数据处理逻辑呢?有没有什么api可以知道的或者怎么打个

flink怎么判断全量已经跑完了,开始走增量的数据处理逻辑呢?有没有什么api可以知道的或者怎么打个标记?image.png

展开
收起
雪哥哥 2022-10-29 23:43:07 1104 0
4 条回答
写回答
取消 提交回答
  • 这个属于同步的指标。需要看楼主使用哪种同步方案,Debezium、或者是FlinkCDC,前端可以通过JMX指标来判断,后者理论也有相应的指标

    2023-01-30 13:20:41
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,你可以看一下flink的Checkpoint。Flink的Checkpoint机制的核心思想实质上是通过Barrier来标记触发快照的时间点和对应需要进行快照的数据集,将数据流处理和快照操作解耦开来,从而最大程度降低快照对系统性能的影响。

    2023-01-30 11:05:14
    赞同 1 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    Checkpoint机制可以实现的,Flink有两种基本类型的状态:托管状态(Managed State)和原生状态(Raw State)。从名称中也能读出两者的区别:Managed State是由Flink管理的,Flink帮忙存储、恢复和优化,Raw State是开发者自己管理的,需要自己序列化。

    2023-01-29 15:13:40
    赞同 展开评论 打赏
  • Flink提供了Checkpoint机制,可以用来记录数据处理的进度,以便在出现故障时可以从Checkpoint中恢复,也可以用来判断全量数据是否处理完毕,从而开始走增量数据处理逻辑。 Flink提供了Checkpoint的API,可以用来记录Checkpoint,以及检查Checkpoint是否完成,从而判断全量数据是否处理完毕,开始走增量数据处理逻辑。

    2023-01-17 19:28:23
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载