"
假定流中的事件(包含感兴趣的值)基于事件时间被分配给窗口。在我的情况下,事件不仅无序到达而且迟到,而且事件也是版本化的。我的意思是,对于给定的事件时间,两个事件可能会到达。在这种情况下,窗口应该再次点火。这些事件到来之间的时间可能是几天(甚至几周)。我已经找到了Windows允许的Lateness选项。这是一个可能的解决方案,还是这个数量在许多不能丢弃的窗口中,因为另一个事件可能仍然到达(这基本上归结为问题,如果窗口被持久化或保存在内存中)。"
"一般来说,允许的迟到需要是有限的,以避免保持无限量的状态。但是您可以将Flink配置为使用RocksDBStateBackend,它将状态溢出到磁盘,从而允许与本地磁盘一样多的状态。
如果非常晚期的事件是罕见的,你可能最好以某种特殊的方式来容纳它们,而不是通过所有状态的开销来增加通用管道的负担。"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。