flink将数据全量写入到mysql有什么好的方案吗

一位隐者

如果数据是一条一条过来的，不能先删除再新增，可以考虑使用 MySQL 的 upsert（update or insert）操作，即在写入数据时，如果数据已经存在，则更新数据，否则插入数据。

在 Flink 中，可以使用 JDBCOutputFormat 将数据写入到 MySQL 数据库中，同时设置 upsert 操作。下面是一个示例代码：

DataStream<Tuple2<String, Integer>> stream = ...; // 输入数据流
stream.addSink(JDBCOutputFormat.buildJDBCOutputFormat()
    .setDrivername("com.mysql.jdbc.Driver")
    .setDBUrl("jdbc:mysql://localhost:3306/mydb")
    .setUsername("myuser")
    .setPassword("mypassword")
    .setQuery("INSERT INTO mytable (id, count) VALUES (?, ?) ON DUPLICATE KEY UPDATE count = count + VALUES(count)")
    .setSqlTypes(new int[] {Types.VARCHAR, Types.INTEGER})
    .finish());

在上面的代码中，setQuery 方法设置了 upsert 操作的 SQL 语句，其中 VALUES(count) 表示插入的数据值，ON DUPLICATE KEY UPDATE 表示如果数据已经存在，则执行更新操作。setSqlTypes 方法设置了 SQL 语句中每个参数的数据类型。

如果数据量较大，建议使用批量写入的方式，可以使用 BatchedJdbcOutputFormat 或者 JdbcOutputFormatBuilder.withBatchSize 方法设置批量写入的大小。同时，为了保证数据的可靠性，可以使用 Flink 的 Checkpoint 机制和 MySQL 的事务机制来保证数据的一致性和可靠性。

2023-05-07 23:26:41

赞同展开评论

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

在 Flink 中将数据全量写入到 MySQL 中，主要有以下两种方案：

使用官方提供的 Flink JDBC Connector：Flink 附带了一个通用的 JDBC Connector，可以通过它将数据写入各种关系型数据库中，包括 MySQL。您可以将 MySQL 的连接信息配置在 Flink 程序中，并将数据通过 JDBC 输出到 MySQL 中。具体操作可参考 Flink JDBC Connector 的官方文档：https://ci.apache.org/projects/flink/flink-docs-release-1.13/zh/docs/connectors/datastream/jdbc/
使用 Flink SQL：Flink SQL 是 Flink 的一项新特性，可以使用类 SQL 语句来操作数据。在 Flink SQL 中，可以使用 MySQL Connector 来操作 MySQL 数据库。您可以使用 CREATE TABLE 语句创建 MySQL 表，并使用 INSERT INTO 语句将数据插入到表中。具体操作可参考 Flink SQL 官方文档：https://ci.apache.org/projects/flink/flink-docs-release-1.13/zh/docs/dev/table/connectors/jdbc/

无论您选择哪种方案，建议考虑以下因素：

数据量：如果数据量不是很大，可以考虑直接使用 JDBC Connector 或 Flink SQL 将数据写入 MySQL。
数据实时性要求：如果数据需要实时写入 MySQL，可以使用 Flink 的窗口或者迭代器等机制，将数据按照一定的规则定时输出到 MySQL。如果只需要每隔一定时间将数据写入 MySQL，可以使用 Flink 的定时任务或者使用定时器进行实现。
数据一致性：如果需要保证数据写入 MySQL 后的一致性，可以使用幂等性设计。如果数据一致性要求非常高，可以考虑使用事务机制，将数据写入 MySQL 前在 Flink 中对数据进行处理，保证数据一致性。

2023-05-05 20:21:56

赞同展开评论

穿过生命散发芬芳

Flink 将数据全量写入到 MySQL 数据库有多种实现方式，以下是几种常见的实现方式：

使用 Upsert 方式将数据写入 MySQL：通过 Upsert 方式，可以在 MySQL 数据库中对数据进行更新或插入操作。在 Flink 中，可以使用 jdbc sink 将数据写入 MySQL 数据库，使用 upsert 方法指定写入方式，当主键冲突时，更新记录，否则插入新记录，例如：

val sink = JDBCAppendTableSink.builder()
    .setDrivername("com.mysql.jdbc.Driver")
    .setDBUrl("jdbc:mysql:xxxxxx")
    .setUsername("xxxx")
    .setPassword("xxxx")
    .setQuery("insert into orders values (?,?,?) on duplicate key update order_num=?,order_date=?,total_price=?")
    .setParameterTypes(Types.INT, Types.STRING, Types.DOUBLE, Types.STRING, Types.STRING, Types.DOUBLE)
    .build()
tableEnv.sqlUpdate("insert into orders select * from source", sink)

在使用 Upsert 方式写入数据时，需要在 MySQL 数据库中创建主键，并在 Flink 程序中指定主键字段。

使用事务方式将数据写入 MySQL：将所有数据写入到 MySQL 之前，先启动一个事务，待所有数据写入完成后提交事务。在 Flink 中，可以通过实现 RichSinkFunction 接口，并使用 JDBCConnectionOptions 和 JdbcConnectionProvider 来使用事务将数据写入 MySQL 数据库，例如：

class TransactionalJdbcSink extends RichSinkFunction[Order] {
    private var connection: Connection = _
    private var preparedStatement: PreparedStatement = _
  
    override def open(context: SinkFunction.Context[_]): Unit = {
        connection = DriverManager.getConnection("jdbc:mysql:xxxxxx")
        connection.setAutoCommit(false)
        preparedStatement = connection.prepareStatement("insert into orders values (?,?,?)")
    }
  
    override def invoke(order: Order): Unit = {
        preparedStatement.setInt(1, order.id)
        preparedStatement.setString(2, order.name)
        preparedStatement.setDouble(3, order.price)
        preparedStatement.executeUpdate()
    }
  
    override def close(): Unit = {
        connection.commit()
        connection.close()
    }
}

在使用事务方式写入数据时，需要注意：需要及时释放数据库连接资源，避免占用过多的连接资源，引起数据库性能下降。另外，事务方式写入数据的吞吐量通常较低，因为需要频繁开启和提交事务。

无论使用哪种方式，建议使用 MySQL 的 REPLACE INTO 或 INSERT INTO ON DUPLICATE KEY UPDATE 语句来写入数据，因为这能够最大限度地利用 MySQL 的索引优化。如果使用普通的 INSERT INTO 语句，当数据量较大时，写入速度可能会变得特别慢。与此同时，如果数据表中没有主键或索引，建议在写入前创建主键或索引，以提高写入性能。

2023-05-02 07:47:17

赞同展开评论

Kinging

对于 Flink 的全量写入到 MySQL 的方案，可以考虑使用 Flink 提供的 JDBC sink。以下是一些参考方案：

使用 Flink 的 JDBC sink 写入 MySQL：将 Flink 中的数据通过 JDBC sink 一次性写入 MySQL 中，即使用 JdbcSink 的 batch 方法，并通过 JdbcConnectionOptions 指定 MySQL 数据库连接信息。可以通过设置 batchSize 参数来指定批量写入大小。该方法中，需要将 Flink 的数据类型转换为与 MySQL 数据表匹配的数据类型，如 String、Integer、Timestamp 等。示例代码如下：

public static void main(String[] args) throws Exception {
    StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

    // 读取源数据
    DataStream&lt;MyEvent&gt; source = env
        .addSource(...);

    // 经过处理得到需要写入 MySQL 的数据
    DataStream&lt;Tuple2&lt;String, Integer&gt;&gt; toBeWritten = source
        .filter(...)
        .map(...);

    // 将数据写入 MySQL
    JdbcConnectionOptions connectionOptions = new JdbcConnectionOptions
        .JdbcConnectionOptionsBuilder()
        .withUrl("jdbc:mysql://localhost/mydatabase")
        .withUsername("username")
        .withPassword("password")
        .withDriverName("com.mysql.jdbc.Driver")
        .build();

    JdbcExecutionOptions executionOptions = new JdbcExecutionOptions
        .Builder()
        .withBatchSize(5000)
        .build();

    toBeWritten
        .addSink(
            JdbcSink.sink(
                "INSERT INTO mytable (col1, col2) VALUES (?, ?)",
                (ps, value) -&gt; {
                    ps.setString(1, value.f0);
                    ps.setInt(2, value.f1);
                },
                executionOptions,
                connectionOptions
            )
        );

    env.execute("Writing to MySQL");
}

将 Flink 中的数据写入 CSV 文件，然后将 CSV 文件导入到 MySQL 中，这样可以防止写入过程中的报错对 MySQL 数据库造成影响。可以将数据写入本地磁盘或远程存储如 Amazon S3 中。示例代码如下：

public static void main(String[] args) throws Exception {
    StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

    // 读取源数据
    DataStream&lt;MyEvent&gt; source = env
        .addSource(...);

    // 经过处理得到需要写入 MySQL 的数据
    DataStream&lt;Tuple2&lt;String, Integer&gt;&gt; toBeWritten = source
        .filter(...)
        .map(...);

    // 将数据写入 CSV 文件
    String outputPath = "path/to/output";
    toBeWritten
        .writeAsCsv(outputPath, FileSystem.WriteMode.OVERWRITE, "\n", ",");

    env.execute("Writing to CSV file");
}

将 CSV 文件导入到 MySQL 中，可以使用 MySQL 的 LOAD DATA INFILE 命令，该命令可以将指定格式的数据加载到 MySQL 数据库中。以下是示例代码：

LOAD DATA INFILE '/path/to/file.csv'
INTO TABLE mytable
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;

需要注意的是，LOAD DATA INFILE 命令有安全限制，因此需要确保导入的数据来源可靠，同时也需要确保文件权限正确。此外，在导入数据时需要根据 MySQL 数据表的设置，确保 CSV 文件的内容与表中的数据类型一致，例如文本类型值需要使用引号包裹等等。

综上所述，两种方案都有其适用的场景和优缺点：

直接写入 MySQL 的方案速度更快，但失败后对数据库可能造成影响，也需要进行数据类型的格式化和转换。
将数据写入 CSV 文件再导入到 MySQL 中的方案相对安全，同时也对数据较友好（不需要进行类型转换），但是文件导入的速度有限，需要在导入之前对文件做好数据格式的转换。

需要根据具体的场景情况选择适合的方案。

2023-04-27 21:46:16

赞同展开评论

六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

Flink写出到Mysql需要在Mysql端建表，然后根据MySQL连接器文档在Flink SQL里定义对应的输出表建表语句。在Mysql文档中提到：MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证不多读一条也不少读一条数据。即使发生故障，也能保证通过Exactly Once语义处理数据。MySQL CDC源表支持并发地读取全量数据，通过增量快照算法实现了全程无锁和断点续传，详情可参见关于MySQL CDC源表。

2023-04-26 21:05:45

赞同展开评论

ReaganYoung

值得去的地方都没有捷径

如果数据是一条一条过来的，可以考虑使用Flink的JDBC输出格式，在输出数据到MySQL时，可以使用MySQL的INSERT INTO ... ON DUPLICATE KEY UPDATE语句，这样可以避免先删除再新增的操作，提高数据写入效率。

具体实现可以参考以下步骤：

在Flink中使用JDBC输出格式，将数据写入到MySQL中。 DataStream<Tuple2<String, Integer>> dataStream = ...; dataStream.addSink(JdbcSink.sink( "INSERT INTO table_name (col1, col2) VALUES (?, ?) ON DUPLICATE KEY UPDATE col2 = VALUES(col2)", new JdbcStatementBuilder<Tuple2<String, Integer>>() { @Override public void accept(PreparedStatement preparedStatement, Tuple2<String, Integer> t) throws SQLException { preparedStatement.setString(1, t.f0); preparedStatement.setInt(2, t.f1); } }, new JdbcConnectionOptions.JdbcConnectionOptionsBuilder() .withUrl("jdbc:mysql://localhost:3306/db_name") .withDriverName("com.mysql.jdbc.Driver") .withUsername("username") .withPassword("password") .build())); java 在MySQL中创建一个唯一索引，以便使用ON DUPLICATE KEY UPDATE语句。 CREATE UNIQUE INDEX unique_index_name ON table_name (col1); sql 这样，当有新数据来临时，如果该数据已经存在，就会更新该数据，如果该数据不存在，就会插入一条新数据。

注意：如果数据量过大，可以考虑使用批量写入的方式，即将多条数据一次性写入到MySQL中，以提高写入效率。

2023-04-26 12:31:40

赞同展开评论

筝樾

通过JDBCOutputFormat 在flink中没有现成的用来写入MySQL的sink，但是flink提供了一个类，JDBCOutputFormat，通过这个类，如果你提供了jdbc的driver，则可以当做sink使用。

JDBCOutputFormat其实是flink的batch api，但也可以用来作为stream的api使用，社区也推荐通过这种方式来进行。

JDBCOutputFormat用起来很简单，只需要一个prepared statement，driver和database connection，就可以开始使用了。

2023-04-25 14:34:30

赞同展开评论

魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

在 Flink 中将数据全量写入到 MySQL，有很多种方案可以选择，以下是其中的几种：

使用 JDBCOutputFormat：在 Flink 1.11 及以后的版本中，可以通过使用 JDBCOutputFormat 将 DataStream 中的数据写入到 MySQL 数据库中。具体实现方法可以参考 Flink 的文档：Writing to relational databases using JDBC。

使用 Flink SQL：Flink 支持使用 SQL 语句来操作数据流，并可以将结果写入到 MySQL 数据库中。可以使用 Flink 提供的 JDBC connector 将数据流中的数据写入到 MySQL 数据库中，具体实现方法可以参考 Flink 的文档：Connect to MySQL using JDBC。

自定义 SinkFunction：可以自定义 SinkFunction 来将 DataStream 中的数据写入到 MySQL 数据库中。具体实现细节可以参考 Flink 的文档：Custom Sinks。

2023-04-25 11:06:14

赞同展开评论

游客kmd2gbly4yh72

如果您想将数据从 Flink 全量写入 MySQL，强烈建议使用批处理方式而不是逐行插入的方式。一种可行的方案是使用 Flink 的 JDBCOutputFormat 将数据写入 MySQL。

具体步骤如下： 1. 在连接MySQL时，请先确定合适的bulk大小，在特定情况下增加batchsize有助于提高性能。 2. 如果要进行全量写入，则需要在代码中指定删除和写入操作顺序，并确保无法在上一个操作完成之前触发下一个操作。 3. 使用 JdbcOutputFormat.buildJdbcOutputFormat() 方法创建 JDBC 输出格式对象，并使用该方法的参数设置数据库连接信息，表名、字段列表等。 4. 使用 writeRecord() 方法将记录插入到输出格式中。 5. 当所有记录都已经被插入到输出格式中，可以调用 finish() 方法提交当前事务。

请注意：这个过程自身存在风险，所以我们应该谨慎地处理任何与现有数据相关的操作。当考虑分割流 (Split streams) 处理更改事件时（例如，Flink 增量更新），我们还必须为SQL编写自定义udf来解析完整记录并生成正确的语句。

2023-04-24 18:50:35

赞同展开评论

爱吃白菜的GGB

如果您需要将 Flink 中的数据全量写入到 MySQL 数据库中，可以考虑使用 Flink 的 JdbcSink，它可以将 DataStream 中的数据写入到 MySQL 数据库中。对于全量写入，您可以先将 MySQL 数据库表中的数据删除，然后再将 DataStream 中的数据插入到 MySQL 数据库表中，示例代码如下：

// 定义 MySQL 数据库连接信息
final String url = "jdbc:mysql://localhost:3306/test";
final String username = "root";
final String password = "123456";
final String driverName = "com.mysql.jdbc.Driver";
// 定义要写入的数据
DataStream<Tuple2<String, Integer>> dataStream = ...;
// 将数据写入到 MySQL 数据库中
dataStream.addSink(JdbcSink.sink(
    "insert into test_table (name, value) values (?, ?)",
    new JdbcStatementBuilder<Tuple2<String, Integer>>() {
        @Override
        public void accept(PreparedStatement pstmt, Tuple2<String, Integer> t) throws SQLException {
            // 绑定参数
            pstmt.setString(1, t.f0);
            pstmt.setInt(2, t.f1);
        }
    },
    // 定义 MySQL 数据库连接信息
    new JdbcConnectionOptions.JdbcConnectionOptionsBuilder()
        .withUrl(url)
        .withUsername(username)
        .withPassword(password)
        .withDriverName(driverName)
        .build()
));

在上面的示例中，dataStream 是要写入到 MySQL 数据库中的数据流，包含了每个数据的 name 和 value。JdbcSink 的第一个参数是 SQL 插入语句，第二个参数是一个 JdbcStatementBuilder，用于将 Tuple 类型的数据转换为 SQL 语句中的参数。在 JdbcStatementBuilder 的 accept 方法中，您可以通过 PreparedStatement 绑定参数。最后，通过 JdbcConnectionOptions 类指定 MySQL 数据库的连接信息。

2023-04-24 13:23:40

赞同展开评论

叶秋学长

全栈JAVA领域创作者

如果需要将 Flink 中的数据全量写入到 MySQL 中，可以考虑使用 MySQL 的 LOAD DATA INFILE 命令，该命令可以快速地将大量数据写入到 MySQL 中。

具体来说，可以按照以下步骤进行操作：

将 Flink 中的数据写入到本地文件中，例如 CSV 文件。可以使用 Flink 的 writeAsCsv() 函数将数据写入到 CSV 文件中。例如：

DataStream<MyData> input = ...; // Get input stream
input.writeAsCsv("file:///path/to/file.csv", FileSystem.WriteMode.OVERWRITE);

在该代码中，首先获取 MyData 类型的输入流 input，然后将数据写入到本地文件中。

将本地文件上传到 MySQL 服务器中。可以使用 SCP 或其他文件传输工具将本地文件上传到 MySQL 服务器中。例如：

scp /path/to/file.csv user@mysql-server:/path/to/file.csv

在该命令中，将本地文件 /path/to/file.csv 上传到 MySQL 服务器上的 /path/to/file.csv 目录中。

在 MySQL 中执行 LOAD DATA INFILE 命令，将数据导入到 MySQL 中。例如：

LOAD DATA INFILE '/path/to/file.csv'
INTO TABLE my_table
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n';

在该命令中，将本地文件 /path/to/file.csv 中的数据导入到 MySQL 数据库的 my_table 表中，使用逗号分隔字段，换行分隔行。

需要注意的是，LOAD DATA INFILE 命令会将数据全量写入到 MySQL 中，并且该操作是一个原子操作，具有较高的性能和稳定性。同时，由于数据是一条一条过来的，无法先删除再新增，因此需要先将数据写入到本地文件中，然后再将文件上传到 MySQL 服务器中，再执行导入命令。

2023-04-23 21:32:48

赞同展开评论

huc_逆天

技术架构师阿里云开发者社区技术专家博主 CSDN签约专栏技术博主掘金签约技术博主云安全联盟专家众多开源代码库Commiter

对于将数据全量写入到 MySQL 的场景，通常有以下几种方案：

使用 Flink 的 JDBCOutputFormat 进行批量写入：在这种方案中，Flink 会将输入的记录缓存到内存中，当缓存满了或者达到一定时间间隔后，批量地将其写入到 MySQL 数据库。这种方式适用于需要大量写入数据的场景，并且可以通过调整缓存大小和时间来优化写入性能。
将数据先写入到 Kafka 中，再使用 Flink 的 Kafka Consumer 将数据读取出来写入到 MySQL：这种方案可以实现数据的实时写入，并且具备较高的可靠性和容错性。同时，由于 Kafka 具备高吞吐量和水平扩展性，该方案也适用于处理大规模数据的场景。
使用 MySQL 的 insert on duplicate key update 功能进行更新：在这种方案中，你可以直接将数据插入到 MySQL 表中，如果遇到重复的主键，则执行更新操作。这种方法在数据更新比较频繁的情况下，可以降低系统的复杂度，提高数据的写入效率。

以上三种方案各有优缺点，具体的选择需要根据业务场景和需求进行权衡。不过需要注意的是，在实际应用中，为了保证数据的一致性和完整性，通常需要在写入数据时开启事务，并对失败的写入操作进行重试或者回滚。

2023-04-23 17:26:00

赞同展开评论

祁符建

热爱开发

在 Flink 中将数据全量写入到 MySQL，可以考虑以下几种方案：

使用 JDBCOutputFormat Flink 提供了 JDBCOutputFormat，可以用于将数据写入到关系型数据库中。您可以将数据流通过 map() 等算子进行转换，然后使用 JDBCOutputFormat 将数据写入到 MySQL 数据库中。

例如：

DataStream dataStream = ...;

dataStream .map(new MyDataToRowMapper()) .writeUsingOutputFormat(JDBCOutputFormat.buildJDBCOutputFormat() .setDrivername("com.mysql.jdbc.Driver") .setDBUrl("jdbc:mysql://localhost:3306/mydatabase") .setQuery("INSERT INTO mytable (field1, field2) VALUES (?, ?)") .setUsername("myuser") .setPassword("mypassword") .finish()); 在上述代码中，我们首先将输入的 MyData 数据流通过自定义的 MyDataToRowMapper 转换为 Row 类型，然后将其输出到 MySQL 数据库中。

需要注意的是，JDBCOutputFormat 每次都会新建一个连接并提交事务，因此如果数据量较大，则可能导致性能问题，并且当写入失败时就无法保证事务的一致性。因此，该方法适合小规模数据的写入场景。

使用 UpsertStreamTableSink Flink 1.9 及以上版本提供了 UpsertStreamTableSink 接口，可以用于将数据流写入到支持 upsert（类似于 MySQL 中的 INSERT ON DUPLICATE KEY UPDATE）操作的数据库中。您可以通过实现 UpsertStreamTableSink 接口，将数据流转换为 Table，并指定 upsert 操作的字段和 SQL 语句。

例如：

DataStream dataStream = ...;

final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);

StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);

tableEnv.registerDataStream("my_table", dataStream, "field1, field2, event_time.rowtime"); tableEnv.sqlUpdate("CREATE TABLE my_mysql_table (field1 LONG, field2 STRING, event_time TIMESTAMP(3), PRIMARY KEY (field1) NOT ENFORCED) WITH ('connector' = 'jdbc', 'url' = 'jdbc:mysql://localhost:3306/mydatabase', 'table-name' = 'mytable', 'username' = 'myuser', 'password' = 'mypassword')");

tableEnv.sqlUpdate("INSERT INTO my_mysql_table SELECT field1, field2, MAX(event_time) AS event_time FROM my_table GROUP BY field1, field2");

env.execute(); 在上述代码中，我们首先将输入的 MyData 数据流注册为 Flink Table，并在其中添加时间戳字段 event_time。然后，我们使用 sqlUpdate() 方法创建了一个新的 MySQL 表 my_mysql_table 并将其注册为 Flink Table。在表注册时，我们指定了该表的 JDBC 连接信息、表名、用户名和密码等参数。

最后，我们对 my_table 数据流执行了一个简单的聚合操作，将相同 field1 和 field2 的记录合并为一条，并取其中最新的时间戳作为 event_time。然后，我们将聚合结果插入到 MySQL 表中。

需要注意的是，UpsertStreamTableSink 适用于支持 upsert 操作的数据库（例如 MySQL），能够保证写入数据时的事务一致性，并且能够处理高并发和大规模数据的写入场景。但是该接口只能用于 Table API 或 SQL 语句的场景，不适用于 DataStream 的原生操作。

希望以上方案能够对您有所帮助！

2023-04-23 17:11:31

赞同展开评论

vohelon

Flink 中如果要将数据全量写入到 MySQL 数据库，一般有以下两种方案：

使用批量提交

基本思路是先将数据缓存到本地，然后按照一定的大小进行批量提交。这个方案的具体实现可以用 Flink 官方提供的 JDBCOutputFormat，以及 MySQL 支持的 batch insert 语句。具体步骤如下：

将 DataStream 转换为 DataSet（支持批处理）；
写一个继承了 JDBCOutputFormat 的 OutputFormat，并实现其 writeRecord() 方法，其中 writeRecord() 方法接收一条记录，将这条记录封装成 PreparedStatement；
使用 DataSet 的 output() 方法，并将上述 OutputFormat 传入；
将 DataSet 执行批量执行操作。

可以先将数据缓存在 List 中，然后按照缓存大小批量提交，这样可以减少对数据库的压力。但是在数据更新时，因为不能先删除再新增数据，所以需要考虑数据的更新策略，具体方式可以通过对主键进行校验来实现。

使用 Upsert 方式

除了批量提交之外，还可以使用 Upsert 方式将数据写入到 MySQL 数据库中。具体步骤如下：

使用 Flink 官方提供的 UpsertStreamTableSink 创建 UpsertJDBCOutputFormat，该 OutputFormat 会将 upsert 操作映射为一批 insert / update / delete 操作，最终提交到数据库中；
对需要写入的数据进行转换，转换为 Table；
将 Table 转换为 DataStream；
将 DataStream 传入 UpsertJDBCOutputFormat。

2023-04-23 16:42:45

赞同展开评论

flink将数据全量写入到mysql有什么好的方案吗

实时计算 Flink

相关文章

热门讨论

热门文章