文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

前辈，Flink CDC中我表1是1500万条，表2是250万条数据。速度跟数据量有关吗，比例抽取？

问题1:前辈，Flink CDC中我表1是1500万条，表2是250万条数据。速度跟数据量有关吗，比例抽取？1500万条的表跑了10分钟；250万条的表跑了9小时，跑出oracle的ORA-01555 snapshot too old了问题2:用DataStream的方式，不要的字段有办法过滤吗。在序列化的时候过滤不知道合不合理

展开

收起

真的很搞笑 2023-06-18 13:15:03 94 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

回答1:稳定运行之后差不多，总得执行时间会不同，批量跑试试，此回答整理自钉群“Flink CDC 社区”

2023-06-18 14:05:08

赞同展开评论

问答分类：

Oracle 关系型数据库流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版数据实时计算 Flink版cdc数据实时计算 Flink版cdc数据量实时计算 Flink版数据量

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请问一下 Flink CDC 方式同步，目标数据量比源数据偏多问题

412

1

0

Flink结果表数据量正确性问题

144

1

0

Flink CDC里每次同步pg固定的数据量就报这个错，有大佬知道为什么吗?

103

1

0

Flink CDC里tidb cdc 数据量大了就疯狂报空指针怎么处理啊？

155

1

0

Flink CDC输出数据量降低是因为有大量数据删除嘛？

115

0

0

用Flink CDC做 ETL。4张表的数据量都接近1亿，checkpoint一直失败，如何调优呢？

181

1

0

Flink状态后端数据量较大时，如何进行问题排查？

140

1

0

在Flink CDC中数据量太大第一次全量同步咋整？

149

1

0

在Flink CDC中Doris中的数据比MySql中的数据量要多是啥情况？

124

0

0

Flink cdc source Records Sent比物理表数据量大

149

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

MavenRunHelper.jar 使用步骤详解（附Maven命令执行与main方法运行）

phpwind_UTF8_8.5部署步骤详解（含环境准备+安装教程）

PostgreSQL窗口函数从入门到实操

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

热门讨论

热门文章

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink有2023 Flink Forward Asia 资料下载地址吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

Flink中，遇到cdc 同步中文表和中文列乱码怎么处理？

Flink sql将数组炸开，实现hive的explode函数的效果，还有什么其他好的方式？

pyflink在读取hdfs文件的时候如何使用通配符？

大佬们，请教下，Flink CDC2.4.0版本的mysql cdc，怎么设置时区"？

Flink1.10 python API 对流式处理的支持度如何，能直接用于生产吗？

提交flink命令后运行时会优先加载 lib下面的jar包吗？严重怀疑平台提供的cdc不是2.1

展开全部

数据仓库介绍与实时数仓案例

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?