Flink CDC大佬们,map完之后延迟比较久才到keyby算子是什么问题啊?
DataStream 中的数据量较大,导致 map 操作耗时较长。
map 操作的并行度较低,导致 map 操作耗时较长。
数据源是 Kafka 或者 Kinesis,这两个数据源的读取速度较慢,导致 map 操作耗时较长。
网络带宽较低,导致数据传输速度较慢,导致 map 操作耗时较长。
其他原因,比如代码 Bug 等。
建议你检查一下自己的代码,看是否存在上述问题。如果存在上述问题,请根据问题原因进行相应的调整。
如果没有发现问题,可以尝试调大 map 的并行度,或者将数据源改为其他速度更快的数据源。如果仍然无法解决问题,可以联系 Flink 官方支持,他们会帮助你进行排查。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。