实时计算 Flink版产品使用问题之在online模式下增量抓取Oracle数据时,在archive_log切换时,出现数据丢失的情况,是什么原因

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一:flink1.17.1 cdc 2.4.2也有这个问题呢?

flink1.17.1 cdc 2.4.2也有这个问题呢?cdc拿到数据后,时间少了两个00



参考答案:

你可以自定义下debezium的Converter.



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587184



问题二:flinkcdc目前用的是 flinkcdc 2.2.1 , 在哪个版本有修复个问题呢?

今天发现个问题,1 在数据库里的update_time='2024-01-04 11:00:12.200' flinkcdc拿到数据发给kafka的是 2024-01-04 11:00:12.2 它把最后两个00去掉了,目前用的是 flinkcdc 2.2.1 , 在哪个版本有修复个问题呢?



参考答案:

现在已经到3.0 了 可以去官网看看升级点 介绍



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587181



问题三:Flink CDC2.4用online模式增量抓取oracle数据有数据丢失,有了解这个情况的吗?

Flink CDC2.4用online模式增量抓取oracle数据有数据丢失,跟踪采集过程,发现如果是在archive_log切换的时候。有了解这个情况的吗?



参考答案:

Flink CDC 2.4在online模式下增量抓取Oracle数据时,如果在archive_log切换的时候可能会出现数据丢失的情况。这可能是因为Flink CDC无法正确处理归档日志的切换导致的。

要解决这个问题,你可以尝试以下方法:

  1. 确保你的Flink CDC作业配置正确,包括数据库连接信息、日志读取位置等。
  2. 检查Oracle数据库的归档日志设置,确保归档日志的切换不会中断数据的连续性。你可以调整归档日志的切换策略或增加归档日志保留时间来减少切换的频率。
  3. 如果可能的话,尝试使用Flink CDC的其他模式,如incremental模式或complete模式,以获取更稳定的数据抓取结果。
  4. 如果问题仍然存在,建议向Flink社区或相关技术支持渠道寻求帮助,提供详细的错误日志和配置信息,以便他们能够更好地帮助你解决问题。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587179



问题四:Flink CDC 3.0支持mysql到es或者doris到es吗?

Flink CDC 3.0支持mysql到es或者doris到es吗?



参考答案:

还没支持,现在只有这俩



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587178



问题五:我的Flink CDC的jobmanager内存总是持续升高直到宕机,这个是什么原因呀?

我的Flink CDC的jobmanager内存总是持续升高直到宕机,这个是什么原因呀,有解决思路么?



参考答案:

Flink CDC的jobmanager内存持续升高直到宕机可能是由于以下原因之一:

  1. 数据量过大:如果处理的数据量非常大,可能会导致jobmanager内存不足。可以尝试增加jobmanager的内存大小或者优化数据处理逻辑以减少内存占用。
  2. 反压机制问题:当处理速度跟不上数据产生速度时,可能会出现反压机制导致内存持续升高。可以检查反压机制的配置是否正确,并尝试调整相关参数以解决该问题。
  3. 资源竞争:如果有其他任务或应用程序与Flink CDC jobmanager竞争内存资源,也可能导致内存持续升高。可以尝试减少其他任务的资源占用或者增加jobmanager的内存分配。
  4. 内存泄漏:可能存在内存泄漏的情况,导致内存无法释放。可以使用内存分析工具来定位和修复内存泄漏问题。

综上所述,需要进一步分析和调试才能确定具体的原因,并采取相应的措施来解决该问题。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/587177

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
4月前
|
分布式计算 资源调度 大数据
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(一)
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(一)
129 0
|
4月前
|
分布式计算 资源调度 大数据
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(二)
大数据-110 Flink 安装部署 下载解压配置 Standalone模式启动 打包依赖(二)
113 0
|
6月前
|
SQL 运维 Oracle
【迁移秘籍揭晓】ADB如何助你一臂之力,轻松玩转Oracle至ADB的数据大转移?
【8月更文挑战第27天】ADB(Autonomous Database)是由甲骨文公司推出的自动化的数据库服务,它极大简化了数据库的运维工作。在从传统Oracle数据库升级至ADB的过程中,数据迁移至关重要。
94 0
|
3月前
|
存储 Oracle 关系型数据库
【赵渝强老师】Oracle的还原数据
Oracle数据库中的还原数据(也称为undo数据或撤销数据)存储在还原表空间中,主要用于支持查询的一致性读取、实现闪回技术和恢复失败的事务。文章通过示例详细介绍了还原数据的工作原理和应用场景。
【赵渝强老师】Oracle的还原数据
|
3月前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的联机重做日志文件与数据写入过程
在Oracle数据库中,联机重做日志文件记录了数据库的变化,用于实例恢复。每个数据库有多组联机重做日志,每组建议至少有两个成员。通过SQL语句可查看日志文件信息。视频讲解和示意图进一步解释了这一过程。
|
3月前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的数据文件
在Oracle数据库中,数据库由多个表空间组成,每个表空间包含多个数据文件。数据文件存储实际的数据库数据。查询时,如果内存中没有所需数据,Oracle会从数据文件中读取并加载到内存。可通过SQL语句查看和管理数据文件。附有视频讲解及示例。
|
4月前
|
资源调度 分布式计算 大数据
大数据-111 Flink 安装部署 YARN部署模式 FlinkYARN模式申请资源、提交任务
大数据-111 Flink 安装部署 YARN部署模式 FlinkYARN模式申请资源、提交任务
151 0
|
4月前
|
Oracle 关系型数据库 数据库
oracle数据创建同义词
oracle数据创建同义词
67 0
|
5月前
|
Ubuntu Oracle 关系型数据库
Oracle VM VirtualBox之Ubuntu 22.04LTS双网卡网络模式配置
这篇文章是关于如何在Oracle VM VirtualBox中配置Ubuntu 22.04LTS虚拟机双网卡网络模式的详细指南,包括VirtualBox网络概述、双网卡网络模式的配置步骤以及Ubuntu系统网络配置。
497 3
|
6月前
|
关系型数据库 MySQL 数据处理
实时计算 Flink版产品使用问题之mini-cluster模式下,怎么指定checkpoint的时间间隔
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多