开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

Flink CDC首次全量同步几百万数据,状态后端增量方式的rocksdb,正常的吗?

Flink CDC首次全量同步几百万数据,状态后端增量方式的rocksdb,目前Checkpointed Data Size 基本接近Full Checkpoint Data Size大小,正常的吗?ck耗时也很长,请问可以从哪些方面优化优化?a5003f29e032c00500b98d0a8cefeebd.png
9c18198191b2f69803ca440f5a3a924b.png

展开
收起
真的很搞笑 2024-01-09 11:28:11 84 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Flink CDC首次全量同步几百万数据,状态后端增量方式的rocksdb,目前Flink CDC首次全量同步几百万数据,状态后端增量方式的rocksdb,目前Checkpointed Data Size基本接近Full Checkpoint Data Size大小,这是正常的。ck耗时也很长,可以从以下几个方面优化:

    1. 调整checkpoint间隔时间,缩短checkpoint时间。
    2. 调整statebackend的大小,增加statebackend的容量。
    3. 调整并行度,提高处理速度。
    2024-01-09 15:34:19
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Apache Flink 案例集(2022版) 立即下载
    十分钟上线-使用函数计算构建支付宝小程序服务 立即下载
    机器学习在互联网后端技术中的应用 立即下载