文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flinkcdc读取binlog后，是直接写入hive，还是先到kafka，写入hive呢？

flinkcdc读取binlog后，是直接写入hive，还是先到kafka，然后hive端消费kafka，写入hive呢？https://mp.weixin.qq.com/s?__biz=MzI1OTM5NDY0Mg==&mid=2247561212&idx=3&sn=dcfaf2b287200a40d728f169808cb727&chksm=ea7a32c1dd0dbbd7dbaa56b38075720d7e8a2833bf1c4d12d5eb9cc97e417e003221e27763b7&scene=27&poc_token=HIv9EGWj6UPQyyo8_EFiJZ0KBodsTeod9Q2-QKA2

展开

收起

真的很搞笑 2023-10-02 14:17:26 291 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

街头艺术家

FlinkCDC读取binlog后，通常会先写入Kafka，然后再写入Hive。这是因为Kafka是一个高吞吐量的分布式消息队列，可以提供高效的数据传输和处理。通过将数据先写入Kafka，可以降低FlinkCDC的压力，提高数据处理的性能和稳定性。此外，Kafka还提供了强大的数据流处理能力，可以方便地进行数据清洗、转换和聚合操作，从而进一步提高数据的质量和一致性。

2023-10-12 17:01:57

赞同展开评论
芯在这

现在应该定义一下catalog, 直接写hive, 很久之前, 试过写hdfs目录, 反正hive元数据就是映射的hdfs路径, 定时flush, 然后hive表就能查到数据了，此回答整理自钉群“Flink CDC 社区”

2023-10-04 07:39:54

赞同展开评论

问答分类：

SQL 消息中间件 Kafka HIVE 云消息队列 Kafka 版实时计算 Flink版

问答标签：

flinkcdc binlog flinkcdc云消息队列 Kafka 版云消息队列 Kafka 版flinkcdc binlog flinkcdc binlog kafka

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flinkcdc支持任务起动后不重启的情况下mysql source能捕获新建表的binlog吗?

276

1

0

FlinkCDC监听Mysql binlog，建立链接不会释放

321

1

0

为什么使用FlinkCDC和Kakfa Sink向Kakfa中发送binlog数据，会存在脏数据？

374

1

0

FLinkcdc 在初始化快照阶段的时候是不是就会记录下binlog点位？

235

1

0

使用flinkcdc 3.1.1 同步mysql到kafka，改表结构之后就不能从特定位置起了吗？

241

1

0

flinkcdc同步oracle到kafka刚开始加了那两个参数可以秒级监控，有经验知道怎么排查吗？

174

0

0

flinkcdc 采集mysql出现卡在某个binlog文件出不来怎么办？

245

0

0

flinkcdc在监听binlog时如果程序停掉，中途又新增，如何让程序在停掉的点重新监听？

788

9

0

flinkcdc在监听binlog的时候如果程序停掉了，如何能让程序在停掉的那个点重新监听呢？

194

1

0

有大佬知道这是怎么回事么 flink读不到kafka数据

1495

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

RabbitMQ 消息队列实战：交换机、队列与消息转换器全解析（2026 实测）

2026免费BI产品选择指南，真实测评与推荐

SQL Server迁移必看！深度解析SQLServer兼容性三大核心维度与选型指南

为什么我说PostgreSQL是Agent Database的最佳选择

乌镇大赛丨5 万奖金已备好！RocketMQ 等你一起打造全新 AI-Native 管控平台

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC 能适配达梦不？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC全量没问题，增量报错 file is not a valid field name

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

展开全部

还有其他疑问?