备案控制台

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

谁能解答？从mysql的binlog读取数据到kafka，但是数据类型有Insert,updata,

谁能解答？从mysql的binlog读取数据到kafka，但是数据类型有Insert,updata,delete ,如何保证通过flink流式计算kafka出来的结果跟在mysql计算出来的一样呢？就比如，mysql是select id,sum(money) money from tb1 group by id; 那么此时flink sql应该怎么写呢？

展开

收起

游客3oewgrzrf6o5c 2022-08-04 17:18:45 380 0

1 条回答

写回答

取消提交回答

genius985

nnn

对于从MySQL的binlog读取数据到Kafka，并且需要保证通过Flink流式计算得到的结果与在MySQL中计算得到的结果相同，你可以按照以下步骤进行处理：

配置MySQL的binlog读取：使用适当的工具或库（如Debezium等），配置MySQL的binlog读取，并确保监控并捕获Insert、Update和Delete操作的数据变化。

将数据写入Kafka：将捕获到的数据以适当的格式发送到Kafka主题中。这可以通过编写自定义代码来实现，也可以使用现有的工具或库。

使用Flink进行流式计算：在Flink中配置流式计算作业，以读取Kafka中的数据，并执行相应的聚合操作（如sum）和分组操作（如group by）。你可以使用Flink SQL或Flink的DataStream API来实现计算逻辑。

与MySQL计算结果进行比较：为了确保Flink计算得到的结果与在MySQL中计算得到的结果相同，你可以定期或实时地将Flink计算结果与MySQL计算结果进行比较验证。这可以通过编写自定义代码来实现，以查询MySQL并与Flink计算结果进行比较。

需要注意的是，在进行比较时，由于数据变化的性质（例如删除操作），可能存在一些差异。你可能需要针对特定情况进行一些处理，例如忽略已删除的数据或添加适当的过滤条件。

总结起来，你需要配置MySQL的binlog读取，将数据写入Kafka，使用Flink进行流式计算并执行相应的聚合和分组操作，然后将计算结果与MySQL计算结果进行比较验证。这样可以确保通过Flink流式计算得到的结果与在MySQL中计算得到的结果一致。

2023-07-06 10:35:24

赞同展开评论打赏

问答分类：

消息中间件关系型数据库 MySQL Kafka 实时计算 Flink版云消息队列 Kafka 版云数据库 RDS MySQL 版

问答标签：

云数据库 RDS MySQL 版数据 mysql binlog binlog数据 mysql数据云消息队列 Kafka 版数据云消息队列 Kafka 版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

实时计算 Flink版

在Flink CDC中flink job mysql->kafka为啥管理界面看不到记录处理条数？

26

1

0

RDS MySQL有哪些数据类型

17

1

0

flink cdc datastream方式同步mysql数据到kafka，多分区怎么保证有序性？

39

1

0

如果用flinksql的方式同步mysql数据到kafka，是类似DTS那样吗？

18

1

0

在Flink CDC中这种模式Kafka到mysql可以kakfa到doris不行，也不报错为什么？

37

0

0

在Flink CDC中MySQL 整库同步 Kafka，不支持动态加表功能吗？

33

1

0

在Flink CDC中为什么mysql中新增数据，在kafka中，消费者看不到新增的数据？

31

0

0

RDS PostgreSQL实时采集数据到Kafka 的工具

26

1

0

polardb不支持mysql的polygon数据类型吗？

19

1

0

数据传输DTS是否支持其他云厂商的MySQL实时同步至阿里云的Kafka中

19

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

请问flink cdc sql中如何将一个json格式字符串转换成格式？

请问下有实现达梦数据库的 Flink CDC么?

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

flink 1.18必须配套JDK11吗 1.8是不是不行了呢？

Flink CDC 能适配达梦不？

哪位大佬有遇到过Flink这个问题呢？同步pg的时候，是不是类冲突了，所以导致抓不到这个类？

请问如何用flink sql客户端用yarn application模式提交任务呢？

flink 消费kafka,之前任务正常的，突然有个分区没法消费了，重启下任务久正常了？

展开全部

分布式Snapshot和Flink Checkpointing简介

Flink SQL 功能解密系列 —— 维表 JOIN 与异步优化

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何正确使用 Flink Connector？

使用 Kafka 和 Flink 构建实时数据处理系统

展开全部

相关课程

更多

MySQL完全自学手册

5340

35

去学习

MySQL数据库入门学习

30687

23

去学习

MySQL企业常见架构与调优经验分享

12676

7

去学习

云数据库MySQL版快速上手教程

20225

13

去学习

分布式消息系统 Kafka 快速入门

925

24

去学习

阿里云云原生数据仓库AnalyticDB MySQL版使用教程

171

5

去学习

相关电子书

更多

Java Spring Boot开发实战系列课程【第16讲】：Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute 立即下载

消息队列kafka介绍 立即下载

相关实验场景

更多