开发者社区大数据与机器学习实时计算 Flink 正文

各位大佬，对于 Interval Join 未匹配上的数据如何旁路输出呢？

如题

展开

收起

游客3oewgrzrf6o5c 2022-07-03 17:45:32 443 版权

1 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，可以使用阿里云的数据存储和计算服务DataHub来实现未匹配上的数据旁路输出。

具体步骤如下：
1. 在DataHub中创建一个新的Topic用于存储未匹配上的数据。
2. 在Interval Join中添加一个新的match_failure_output配置项，指定未匹配上的数据输出到DataHub中的哪个Topic。
```
set match_failure_output=DatahubOutput(
    "https://dh-cn-hangzhou.aliyuncs.com",
    "<accessKeyId>",
    "<accessKeySecret>",
    "<projectName>",
    "<topicName>",
    "<shardId>"
)
```
1. 设置DataHubOutput的相关参数，包括DataHub的Endpoint、AccessKeyID、AccessKeySecret、ProjectName、TopicName和ShardId。
2. 执行Interval Join，将未匹配上的数据输出到DataHub中。
```
SELECT *
FROM table1
JOIN table2
ON table1.key = table2.key
WITHIN INTERVAL 1 MINUTE
MATCH_INTERVAL (table1.ts, table2.ts)
UNMATCHED_ONLY
INSERT INTO result_table
```
1. 在DataHub中查看未匹配上的数据，并进行后续处理。
2023-08-22 16:45:08

赞同展开评论

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

购买阿里国外的云服务器是否可以访问谷歌？

83797

请问下我访问接口不通什么原因 Provisional headers are shown

3774

this xml file does not appear to have any style in

51922

重启Docker后报错：Error response from daemon

2331

sql server的用户名和密码怎么查啊？

37549

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60954

OSS的endpoint如何查看

37520

LoRa的网络覆盖能力范围是怎么样的？

3222

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3690

阿里云服务器如何重置系统？

24747

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

打造可编程可集成的实时计算平台：阿里云实时计算 Flink被集成能力深度解析

Flink Forward Asia 2025 城市巡回 · 深圳站

Delta Join：为超大规模流处理实现计算与历史数据解耦

Apache Flink 2.2.0: 推动实时数据与人工智能融合，赋能AI时代的流处理

Forrester发布流式数据平台报告：Flink 创始团队跻身领导者行列，实时AI能力获权威认可

各位大佬，对于 Interval Join 未匹配上的数据如何旁路输出呢？

实时计算 Flink

相关文章

热门讨论

热门文章