请教一个解决方案。有没有什么好的思路？

指导一下数据源从Kafka topic1层面消费，经过业务逻辑处理。

根据另一个主题topic2下的打标数据来判定在topic1处理好的数据是否需要进行落库，但是topic2的数据会滞后于topic1，那是需要将topic1的中间状态存储起来么？用state？topic每个订单是会触发3个条记录，topic2的数据可能是在处理第一个记录的时候下发，也可能是处理完3个记录的下发，所以，想问下有什么好方法可以保存这些历史数据么，怕state占用大量内存。

展开

收起

云上静思 2022-07-26 13:18:31 728 版权

1 条回答

写回答

取消提交回答

云墩墩

用state不会占用大量内存的，是放在磁盘上的。感觉这个场景可以用两个KeyedDataStream进行connect，接收到两个不同topic的消息判断在state中是否存在进行处理

此答案来自钉钉群“【2】Apache Flink China 社区”

2022-07-26 14:13:33

赞同展开评论

问答分类：

实时计算 Flink版云消息队列 Kafka 版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

83913

请问下我访问接口不通什么原因 Provisional headers are shown

3853

this xml file does not appear to have any style in

51982

重启Docker后报错：Error response from daemon

2390

sql server的用户名和密码怎么查啊？

37580

LoRa的网络覆盖能力范围是怎么样的？

3236

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60991

OSS的endpoint如何查看

37560

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3707

阿里云服务器如何重置系统？

24771

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

强一致性时代，Kafka、Redis、Celery 谁才是那块短板

kafka入门+代码初步实现--小白必看

Apache Flink 2.2.0: 推动实时数据与人工智能融合，赋能AI时代的流处理

Forrester发布流式数据平台报告：Flink 创始团队跻身领导者行列，实时AI能力获权威认可

kafka总结

请教一个解决方案。有没有什么好的思路？

实时计算 Flink

相关文章

热门讨论

热门文章