开发者社区> 问答> 正文

为什么Flink 维表延迟join?

我么生产环境同样遇到这种问题,因为上有流数据到了,但是维表数据未更新导致丢失部分数据,请问大家现在有好的解决方案去解决Flink SQL 维表延迟Join的问题了吗?

有解决方案的小伙伴能分享下嘛?*来自志愿者整理的flink邮件归档

展开
收起
EXCEED 2021-12-02 14:23:52 1218 0
1 条回答
写回答
取消 提交回答
  • 我们生产环境也遇到了同样的问题,除了benchao说的用算子来做延迟join外。可以使用rocketmq的延迟发送功能来存放维度拼接失败的消息。然后flink再同时消费kafka + rocket mq的数据。 我建议在生产环境使用,因为有的时候flink侧很难判断到底哪种情况是拼接失败,是异常呢,还是空值呢,还是返回结果不符合要求。我觉得在用户层面做会比较灵活。单独的容灾队列对于下游的处理也提供了更多的方式。  

    *来自志愿者整理的FLINK邮件归档

    2021-12-02 14:41:11
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载