开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

想问一下大佬现在cdc采集关系型数据库延时是多少? 后面的引擎用什么比较好?

想问一下大佬现在cdc采集关系型数据库延时是多少? 后面的引擎用什么比较好?

展开
收起
十一0204 2023-04-03 16:58:43 201 0
1 条回答
写回答
取消 提交回答
  • 存在即是合理

    Flink CDC 采集关系型数据库的延时主要取决于多个因素,例如:

    数据库负载和性能; Flink CDC 任务的配置和调优; 数据量和写入频率等。 一般来说,Flink CDC 采集关系型数据库的延时可以做到秒级别的精度,但具体的延时还需要根据实际情况进行评估和测试。在实际应用中,为了保证数据的实时性,可以通过调整 Flink CDC 任务的配置参数、优化数据库性能等方式来尽可能地减少延时。

    至于后续的引擎选择,需要根据实际的应用场景和需求进行评估。Flink CDC 提供了多种 Sink 引擎,例如 MySQL、PostgreSQL、Kafka、HDFS、S3 等,可以根据需要选择合适的 Sink 引擎进行数据下游的处理。如果需要对数据进行实时计算、分析和处理,可以使用 Flink 的流处理引擎进行处理;如果需要进行离线分析和处理,可以将数据写入到 HDFS、S3 等存储系统中,然后使用 Spark 等批处理引擎进行处理。需要根据实际的场景和需求来选择合适的处理引擎和方案。

    2023-04-03 17:13:32
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
2022 DTCC-阿里云一站式数据库上云最佳实践 立即下载
云时代的数据库技术趋势 立即下载
超大型金融机构国产数据库全面迁移成功实践 立即下载