问题1:请问flinkcdc中,upser-kafka会一直存储在kafka里面,攒着内存,那kafka不会吗?我就是在这个群里看到说用upsert-kafka的,要不我都不知道有这个。
问题2:删除topic管用吗?
在 Flink CDC 中,使用 Upsert-Kafka SinkOperator 进行数据同步时,如果 Kafka 的消息队列(message queue)中积累了大量的数据,可能会导致 Kafka 的内存占用较高,从而影响 Kafka 的性能和稳定性。
为了避免这种情况,可以通过调整 Kafka 的配置参数和增加 Kafka 的分区数等方式来优化 Kafka 的性能和扩展性。具体来说,可以采取以下措施:
调整 Kafka 的内存限制参数。
可以根据 Kafka 的实际内存使用情况,适当调整 Kafka 的内存限制参数,例如 max.heap.size、max.request.size 等参数,以避免内存溢出和性能下降。
增加 Kafka 的分区数。
可以根据数据量和负载情况,适当增加 Kafka 的分区数,以提高 Kafka 的并发处理能力和吞吐量。需要注意的是,增加分区数会带来一定的管理和维护成本,需要根据实际情况进行权衡和调整。
设置消息 TTL 时间。
"回答1:普通kafka有默认消息保存时间,一般都设置7-15天之间或者达到阈值开始清理已经消费的数据。
回答2:管用。
此回答整理至钉群“Flink CDC 社区”。"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。