问题转自钉钉群: 21789141
请问怎么做去重?
不理解的是 distinct生效时 flink程序拿到了之前cache的状态值, 做了distinct, 状态值和新来的值都打印出来了, 而且都又计算了一次, 导致本来该算一次的数据算了两次,这种情况应该如何避免呢?
因为是流计算,所以中间状态的每一条数据都会输出,能保证最终的结果是对的。
如果想要中间结果不输出,可以使用固窗来group by。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。