实时计算 Flink版产品使用合集之在读取Oracle归档日志时出现日志数量大幅增加的情况如何解决

简介: 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一:1.13.6的flink,该事务执行时间稍长由比较多的数据被处理,但与该job关注的表无关?


1.13.6的flink,cdc读mysql的binlog,卡在一个binlog点上,就在一直卡在这里。在这期间附近有个其他表的大事务操作发生,该事务执行时间稍长由比较多的数据被处理,但与该job关注的表无关?io.debezium.connector.mysql.MySqlStreamingChangeEventSource [] - Stopped reading binlog after 0 events, no new offset was recorded io.debezium.connector.mysql.MySqlStreamingChangeEventSource [] - Connected to MySQL binlog atMySQL cdc

后来,在卡住大概2小时后发生了OOM


参考回答:

加大内存,mysql binlog机制只能订阅实例的全部表的变更


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/567884


问题二:Flink CDC我那个替换了jar包来着,然后重启的,还是加载2.2.1是什么情况?


Flink CDC我那个替换了jar包来着,然后重启的,还是加载2.2.1是什么情况?没有配置serverid什么的?我用yarn per提交的来着,lib里面也就是一个版本


参考回答:

cdc版本只能存在一个在lib中,具体不清楚能。日志显示2.2.1就是不对的哦,是不是你你还有其他地方不小心引用了


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/567878


问题三:Flink CDC 取oracle归档日志暴涨 怎么解决呀?


Flink CDC 取oracle归档日志暴涨 怎么解决呀?


参考回答:

如果Flink CDC在读取Oracle归档日志时出现日志数量大幅增加的情况,可以从以下几个方面进行处理:

  1. 增加归档日志的记录保留时间:默认情况下,Oracle CDC会将归档日志保留1天。如果数据变化频繁,可以将记录保留时间增加到更长,以避免归档日志被过早删除。
  2. 使用更高效的归档日志压缩格式:通过选择更高效的归档日志压缩格式,可以减少存储空间,降低I/O开销。
  3. 调整Flink CDC的工作负载:如果Flink CDC在短时间内接收到了大量归档日志,可以尝试调整其工作负载,例如减少数据读取速度或增加并发度,以缓解压力。
  4. 升级硬件设备:如果现有的硬件设备无法满足Flink CDC的需求,可以考虑升级硬件设备,如提升CPU性能或扩大内存容量。
  5. 检查并优化相关SQL语句:若在Flink CDC作业中包含SQL查询操作,需要检查是否存在低效的SQL语句,对其进行优化,降低归档日志的产生速度。


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/567876


问题四:Flink CDC中“null”是字符串不是空转不了long?


Flink CDC中“null”是字符串不是空转不了long?


参考回答:

不是的Invalid Java object for schema type STRING: class java.lang.Long for field: "null",字段是null而已,值不是null


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/567871


问题五:Flink CDC有没有人遇到过pg的复制槽,表的复制标识这块设置问题?


Flink CDC有没有人遇到过pg的复制槽,表的复制标识这块设置问题?就是表的复制标识必须设置成full,感觉这个开销大如果是默认主键的逻辑的话好像是会报The "before" field of UPDATE/DELETE message is null, please check the Postgres table has been set REPLICA IDENTITY to FULL level. You can update the setting by running the command in Postgres 'ALTER TABLE public.resident REPLICA IDENTITY FULL'. Please see more in Debezium documentation: https://debezium.io/documentation/reference/1.5/connectors/postgresql.html#postgresql-replica-identity


参考回答:

是的,Flink CDC在处理PostgreSQL数据库时,确实需要确保表的复制标识设置为FULL。这是因为在执行UPDATE/DELETE操作时,Debezium会检查"before"字段是否为null,如果为null,则会报错。因此,为了解决这个问题,你需要在PostgreSQL中运行以下命令来设置表的复制标识为FULL:

ALTER TABLE public.resident REPLICA IDENTITY FULL;

你可以在Debezium文档中找到更多关于PostgreSQL连接器的信息:https://debezium.io/documentation/reference/1.5/connectors/postgresql.html#postgresql-replica-identity


关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/567866

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
存储 消息中间件 Java
Apache Flink 实践问题之原生TM UI日志问题如何解决
Apache Flink 实践问题之原生TM UI日志问题如何解决
149 1
|
11月前
|
监控 Oracle 关系型数据库
Mysql、Oracle审计日志的开启
通过上述步骤,可以在 MySQL 和 Oracle 数据库中启用和配置审计日志。这些日志对于监控数据库操作、提高安全性和满足合规性要求非常重要。确保正确配置审计参数和策略,定期查看和分析审计日志,有助于及时发现并处理潜在的安全问题。
685 11
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的控制文件与归档日志文件
本文介绍了Oracle数据库中的控制文件和归档日志文件。控制文件记录了数据库的物理结构信息,如数据库名、数据文件和联机日志文件的位置等。为了保护数据库,通常会进行控制文件的多路复用。归档日志文件是联机重做日志文件的副本,用于记录数据库的变更历史。文章还提供了相关SQL语句,帮助查看和设置数据库的日志模式。
297 1
【赵渝强老师】Oracle的控制文件与归档日志文件
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的参数文件与告警日志文件
本文介绍了Oracle数据库的参数文件和告警日志文件。参数文件分为初始化参数文件(PFile)和服务器端参数文件(SPFile),在数据库启动时读取并分配资源。告警日志文件记录了数据库的重要活动、错误和警告信息,帮助诊断问题。文中还提供了相关视频讲解和示例代码。
280 1
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的联机重做日志文件与数据写入过程
在Oracle数据库中,联机重做日志文件记录了数据库的变化,用于实例恢复。每个数据库有多组联机重做日志,每组建议至少有两个成员。通过SQL语句可查看日志文件信息。视频讲解和示意图进一步解释了这一过程。
219 0
|
监控 Java Serverless
美团 Flink 大作业部署问题之想在Serverless平台上实时查看Spring Boot应用的日志要怎么操作
美团 Flink 大作业部署问题之想在Serverless平台上实时查看Spring Boot应用的日志要怎么操作
|
消息中间件 Java Kafka
【Azure 事件中心】开启 Apache Flink 制造者 Producer 示例代码中的日志输出 (连接 Azure Event Hub Kafka 终结点)
【Azure 事件中心】开启 Apache Flink 制造者 Producer 示例代码中的日志输出 (连接 Azure Event Hub Kafka 终结点)
167 0
|
SQL 监控 Oracle
Oracle数据误删不用怕,跟我来学日志挖掘
Oracle数据误删不用怕,跟我来学日志挖掘
409 0
|
Kubernetes 关系型数据库 API
实时计算 Flink版产品使用问题之连接的PG表长时间无数据写入,WAL日志持续增长,该如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

相关产品

  • 实时计算 Flink版
  • 推荐镜像

    更多