请问flink cdc 任务怎么做持久化啊? 目前我重启flink后,之前在执行中的任务就丢了 state.backend: rocksdb
Flink的数据持久化你可以了解一下CheckPoint机制。基于异步轻量级的分布式快照技术提供了Checkpoints容错机制,分布式快照可以将同一时间点Task/Operator的状态数据全局统一快照处理,包括前面提到的KeyedState和OperatorState。Flink会在输入的数据集上间隔性地生成checkpointbarrier,通过栅栏(barrier)将间隔时间段内的数据划分到相应的checkpoint中。当异常中断重启时,会从最近的一次checkpoint中读取保存的数据,继续原有数据状态的执行。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。