实时计算 Flink版产品使用合集之Flink CDC 2.3.0和Flink 1.17，无法从MySQL数据库中抽取数据，是什么原因导致的-阿里云开发者社区

实时计算 Flink版产品使用合集之Flink CDC 2.3.0和Flink 1.17，无法从MySQL数据库中抽取数据，是什么原因导致的

2024-05-17 597

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：Flink CDC在集群里面run一个oracle cdc的job，是不是跟什么配置有关系？

Flink CDC在集群里面run一个oracle cdc的job，提示chekpoint保存不了，还没有到启动监听数据源这一步，但用idea调试运行又可以采集，是不是跟什么配置有关系？

我单独用idea来测试是可以的，数据少一点是可以跑，我这个表数据40多万就不行，这个需要配置什么，检查点间隔配置大一点吗？

参考回答：

数据量太大了，执行检查点失败

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570650

问题二：Flink CDC请教下大家，是doris不支持flinksql的sql接口么？

Flink CDC中我flinksql写入doris报这个错，请教下大家，是doris不支持flinksql的sql接口么，Query schema: [station_id: VARCHAR(100), station_name: VARCHAR(255), total_switch_electric_quantity: DECIMAL(38, 2), total_pay_amount: DECIMAL(38, 2), total_order_id_count: BIGINT NOT NULL]

Sink schema: [f0: RAW('com.ibm.icu.impl.Row', ?)]

at org.apache.flink.table.planner.connectors.DynamicSinkUtils.createSchemaMismatchException(DynamicSinkUtils.java:1005)

at org.apache.flink.table.planner.connectors.DynamicSinkUtils.validateSchemaAndApplyImplicitCast(DynamicSinkUtils.java:340)

at org.apache.flink.table.planner.connectors.DynamicSinkUtils.validateSchemaAndApplyImplicitCast(DynamicSinkUtils.java:307)

at org.apache.flink.table.planner.delegation.PlannerBase.translateToRel(PlannerBase.scala:310)

at org.apache.flink.table.planner.delegation.PlannerBase.anonfunanonfunanonfuntranslate$1(PlannerBase.scala:194)

at scala.collection.TraversableLike.anonfunanonfunanonfunmap$1(TraversableLike.scala:233)

at scala.collection.Iterator.foreach(Iterator.scala:937)

at scala.collection.Iterator.foreach$(Iterator.scala:937)

at scala.collection.AbstractIterator.foreach(Iterator.scala:1425)

at scala.collection.IterableLike.foreach(IterableLike.scala:70)

at scala.collection.IterableLike.foreach$(IterableLike.scala:69)

at scala.collection.AbstractIterable.foreach(Iterable.scala:54)

at scala.collection.TraversableLike.map(TraversableLike.scala:233)

at scala.collection.TraversableLike.map$(TraversableLike.scala:226)

at scala.collection.AbstractTraversable.map(Traversable.scala:104)

at org.apache.flink.table.planner.delegation.PlannerBase.translate(PlannerBase.scala:194)

at org.apache.flink.table.api.bridge.internal.AbstractStreamTableEnvironmentImpl.toStreamInternal(AbstractStreamTableEnvironmentImpl.java:224)

at org.apache.flink.table.api.bridge.java.internal.StreamTableEnvironmentImpl.toAppendStream(StreamTableEnvironmentImpl.java:324)

at com.anyixing.energo.realtime.app.dws.FlinkKafkaSQLExample01.main(FlinkKafkaSQLExample01.java:161)？

参考回答：

这个错误是因为Flink SQL的输出格式与Doris的输入格式不匹配。在Flink SQL中，您需要指定一个输出格式，例如ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES ('separatorChar' = ',', 'quoteChar' = '"', 'escapeChar' = '\')。然而，Doris似乎并不支持这种格式，因此导致了错误。

为了解决这个问题，您可能需要查看Doris的文档，看看它支持哪种输入格式，然后在Flink SQL中使用相应的格式。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570201

问题三：cdc2.30 flink1.17，也一直抽取不到mysql的数据？

cdc2.30 flink1.17，也一直抽取不到mysql的数据？

参考回答：

如果你使用的是Flink CDC 2.3.0和Flink 1.17，但是仍然无法从MySQL数据库中抽取数据，那么可能是以下几个原因导致的：

没有正确配置MySQL数据库连接参数。请确保你已经正确配置了MySQL服务器的地址、端口、用户名、密码等信息，并且能够通过这些参数正常访问MySQL数据库。
MySQL数据库没有启用二进制日志功能。Flink CDC需要依赖MySQL的二进制日志功能来获取数据变更事件，因此请确保你的MySQL数据库已经启用了该功能。
MySQL数据库的二进制日志文件已经被清理掉了。默认情况下，MySQL会定期清理掉旧的二进制日志文件，因此请确保你的MySQL数据库已经设置了合理的二进制日志保留策略，以避免丢失数据变更事件。
Flink任务节点与MySQL服务器之间的网络连接不稳定或者带宽不足。在抓取数据变更事件时，Flink任务节点需要不断地从MySQL服务器接收数据，因此请确保两者的网络连接稳定可靠，并且有足够的带宽来传输数据。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570648

问题四：企业版3.2.3.3能使用flink cdc吗？

企业版3.2.3.3能使用flink cdc吗？

参考回答：

企业版3.2.3.3可以使用Flink CDC。Flink CDC是一个用于捕获和处理数据源中变化的技术，它允许实时监视数据库或数据流中发生的数据变动，并将这些变动抽取出来，以便进行进一步的处理和分析。然而，对于某些特定的数据库，例如OceanBase，使用Flink CDC可能会遇到一些问题。因此，在使用Flink CDC时，需要根据具体的数据库版本和配置进行调整。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570647

问题五：flinkcdc2.4.2 flink1.18.0抽取oracle11g一直取不到数什么原因？

flinkcdc2.4.2 flink1.18.0 抽取oracle11g一直取不到数是什么原因呢是需要加什么参数吗？

参考回答：

Flink CDC 2.4.2 配合 Flink 1.18.0 抽取 Oracle 11g 数据无法取到的问题可能有多种原因。首先，可能是因为Flink CDC中的Oracle CDC不支持无锁全量同步表。其次，您需要确保正确配置了Oracle Connector的参数，包括用户名、密码、连接地址、表名等。如果配置不正确，可能导致CDC无法正确读取Oracle数据库中的数据。此外，您可能需要检查您的Oracle数据库版本是否受支持，并确保Flink CDC与Oracle数据库版本兼容。

关于本问题的更多回答可点击原文查看：https://developer.aliyun.com/ask/570645

实时计算 Flink版产品使用合集之Flink CDC 2.3.0和Flink 1.17，无法从MySQL数据库中抽取数据，是什么原因导致的

问题一：Flink CDC在集群里面run一个oracle cdc的job，是不是跟什么配置有关系？

问题二：Flink CDC请教下大家，是doris不支持flinksql的sql接口么？

问题三：cdc2.30 flink1.17，也一直抽取不到mysql的数据？

问题四：企业版3.2.3.3能使用flink cdc吗？

问题五：flinkcdc2.4.2 flink1.18.0抽取oracle11g一直取不到数什么原因？