文档备案控制台

开发者社区问答正文

flink1.12.1 读取kafka的数据写入到clickhouse如何支持upsert操作呢

您好！感谢你在万忙之中，抽出时间来看我发的邮件。最近我在研究使用flink写入数据到clickHouse，如何能满足公司业务需求。但是在用flink1.12.1版本读取kafka的数据，实现upsert的形式写入数据到clickhouse出现了一些问题。问题详细情况描述如下：

clickhouse建表语句如下： CREATE TABLE test_local.tzling_tb3( uuid String, product String, platform String, batchId String, id String, account String, customerId String, reportName String, dt String, campaign String, adGroup String, generalField String, currency String, impressions String, cost String, clicks String, conversions String, createDateTime String, createTime BIGINT, key String, pdate String )engine = MergeTree PARTITION BY pdate order by createTime;

将uuid作为主键，主键存在就更新数据 update，不存在的话，就直接append。

processData.addSink(new MSKUpsertClickHouseSink()); 附件文件MSKUpsertClickHouseSink.java是我写入clickhouse的sink类，设计逻辑为：先查询表中是否存在要添加数据的uuid，如果存在就先做条件删除操作，再做append操作；如果要添加的数据uuid不存在，就直接append操作。当时这样写出现了并发问题,如果并行度大于1，那么clickhouse中会出现uuid不唯一的情况出现。

请问一下，基于上述所说的情况，您有什么好的实践方案可以推荐一下的呢？*来自志愿者整理的flink邮件归档

展开

收起

moonlightdisco 2021-12-08 09:56:27 1590 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

彗星halation

Hi！

你需要在 sink 节点之前添加一个按 uuid 的 hash shuffle 将相同的 uuid 送到相同的并发。如果 processData 是一个 data stream 的话，通过 keyBy 方法 key by uuid，再写入 sink 即可。*来自志愿者整理的flink邮件归档

2021-12-08 10:07:48

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云数据库 ClickHouse 实时计算 Flink版云消息队列 Kafka 版

问答标签：

实时计算 Flink版kafka 实时计算 Flink版数据云消息队列 Kafka 版clickhouse kafka云数据库 ClickHouse 实时计算 Flink版clickhouse

问答地址：

开发者社区 > 微服务 > 问答

相关问答

flink sql输出到upsert kafka 下游再消费一般是upsert 还是 json呀？

184

0

0

如何在Clickhouse中将一个表的数据分组并同步到另一张表中

474

1

0

Flink upsert metarializer是否支持upsert kafka？

130

0

0

DataWorks中mc同步到clickhouse的数据怎么办？

135

1

0

Flink写入Hologres支持upsert操作吗

129

1

0

ClickHouse rds同步数据出现遗漏

134

1

0

Maxcompute数据表中的数据能否导入到自建的ClickHouse中

147

1

0

在Flink CDC中获取的MySql的数据是upsert流，能不能用什么办法给他转化一下？

131

0

0

Flink ClickHouse结果表是否支持回撤更新数据

173

1

0

flinkcdc现在设置ck为3min中，数据延迟感觉有几十秒怎么办？

119

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

如何在阿里云服务器上部署网站？2026年阿里云服务器怎么选？

部署OpenClaw多少钱？2026年阿里云 OpenClaw（Clawdbot）怎么部署及收费标准

阿里云百炼Coding Plan是什么意思？

有传言通义灵码不再增加新功能了，是这样吗？

OpenClaw（原Clawdbot）阿里云一键部署后，2026年有哪些应用场景可用到？

相关文章

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

【最优潮流】二阶锥松弛在配电网最优潮流计算中的应用（Matlab代码实现）

百万消息积压 4 小时，我靠这套方案快速止血

函数计算异步任务在高并发Agent场景下的幂等性与去重实践（附真实踩坑案例）

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

相关解决方案

更多

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

高效存储和处理多媒体数据

还有其他疑问?