文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC消费kafka停止后，使用sp启动，有的拿到的偏移量是-1，导致中间丢数据？

Flink CDC消费kafka停止后，使用sp启动，15个分区都有数据，但是有的拿到的偏移量是-1，导致中间丢数据？

展开

收起

真的很搞笑 2023-10-02 08:40:46 315 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理
当Flink CDC消费Kafka停止后，使用sp启动时，如果某些分区的偏移量为-1，则表示该分区没有可用的数据。这可能是由于在停止Flink CDC消费Kafka时未正确提交偏移量或在重新启动时未正确重置偏移量所致。

要解决这个问题，可以尝试以下思路：
1. 检查Kafka消费者组是否已正确提交了偏移量。可以使用Kafka命令行工具或其他监控工具来查看消费者组的当前偏移量。
2. 如果发现某些分区的偏移量为-1，则可以尝试手动设置这些分区的偏移量。可以使用Flink CDC提供的setStartupMode方法来指定启动模式为“latest”，这将使Flink CDC从最新的偏移量开始消费数据。例如：
  
  Properties properties = new Properties(); properties.setProperty("bootstrap.servers", "localhost:9092"); properties.setProperty("group.id", "test"); properties.setProperty("enable.auto.commit", "false"); properties.setProperty("auto.offset.reset", "earliest"); FlinkKafkaConsumer<String> consumer = new FlinkKafkaConsumer<>( "test_topic", new SimpleStringSchema(), properties); DataStream<String> stream = env.addSource(consumer); stream.setStartupMode(StartupMode.LATEST);
3. 如果仍然无法解决问题，则可能需要重新部署Flink CDC应用程序并确保正确地提交和重置偏移量。
2023-10-23 15:26:34

赞同展开评论

问答分类：

消息中间件 Kafka 流计算云消息队列 Kafka 版实时计算 Flink版

问答标签：

云消息队列 Kafka 版flink 实时计算 Flink版CDC 实时计算 Flink版kafka 实时计算 Flink版数据实时计算 Flink版cdc kafka

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

如何使用Kafka查看偏移量为23的消息？

193

1

0

flink作业数据来源是kafka ，配置偏移量策略是earlest，有什么办法吗？

190

1

0

Flink1.14.4版本消费kafka数据，能外部保存偏移量并维护吗？

511

3

0

问一下设置timestamp读 kafka 一直报错无效偏移量为啥 ?

574

2

0

flinksql消费kafka，没有消费记录的分区在sp的时候是不是不保存偏移量？

183

1

0

有大佬用过flink-connector-mongodb-cdc吗？稳定版的偏移量请问你是怎么处理？

140

1

0

Flink CDC中为啥监控mongodb，写不进去偏移量，导致每次都是从头拿数据？

250

1

0

Flink CDC中用mysql cdc 提交消费偏移量的时候报错，请问有人碰到过吗？

232

1

0

我们通过Flink CDC时间戳偏移量读取mysql binlog，设置了checkpoint，一?

420

0

0

flink支持偏移量存在zookeeper的kafka消费吗？

390

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

阿里云邮件推送（DirectMail）对接使用完全指南：从开通到生产级实践

从同步阻塞到异步解耦：API 异步转型三大核心实战

私域直播小程序开发：直播推流与WebSocket实时通信实践

RabbitMQ 消息队列实战：交换机、队列与消息转换器全解析（2026 实测）

乌镇大赛丨5 万奖金已备好！RocketMQ 等你一起打造全新 AI-Native 管控平台

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

Flink CDC 能适配达梦不？

flinkcdc在IDEA运行正常，打包就报错

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

如何用实时数据同步打破企业数据孤岛？

Flink CDC全量没问题，增量报错 file is not a valid field name

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

广告场景下的实时计算

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Apache Flink 漫谈系列(04) - State

展开全部

还有其他疑问?