Flink 模式下多分分片多路读 batch模式就是多分片多路复用了这是哪里有设置么？

Flink SingleThreadMultiplexSourceReaderBase stream模式下多分分片多路读 batch模式就是多分片多路复用了这是哪里有设置么？

展开

收起

三分钟热度的鱼 2023-12-28 18:38:46 391 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

在Flink中，SingleThreadMultiplexSourceReaderBase的读取模式可以通过StreamExecutionEnvironment进行设置。它支持三种主要的读取模式：STREAMING（默认的流处理模式）、BATCH（批处理模式）以及AUTOMATIC（根据数据源自动选择）。这些模式可以通过命令行参数进行配置，或者在创建和配置StreamExecutionEnvironment时直接在代码中设定。

具体到您的问题，"stream模式下多分片多路读"和"batch模式就是多分片多路复用"，这其实是对同一种处理方式的不同描述。在流处理模式下，Flink会为每个分片创建一个并行的任务来进行处理，这就实现了"多分片多路读"。而当切换到批处理模式时，虽然处理逻辑相似，但Flink会将多个分片的数据合并到一个任务中进行处理，这就是所谓的"多分片多路复用"。

这种设计的背后考虑了外部数据源系统的客户端API调用方式的差异（阻塞、非阻塞、异步），所以SourceReader在设计上支持单分片串行读取、多分片多路复用、多分片多线程三种模式。

2023-12-29 16:14:23

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

Flink SingleThreadMultiplexSourceReaderBase是一个核心类，用于读取分片数据，在stream模式下会多分分片多路读，在batch模式下则是多分片多路复用。
在stream模式下，多分分片多路读是由Kryo序列化器实现的，这是一种默认的序列化器。您可以通过设置StreamExecutionEnvironment.setInputSplitGenerator来控制是否进行多分分片多路读，也可以通过调用readRecords()方法来实现。
在batch模式下，多分片多路复用是由默认的RecordReader实现的，该实现使用了SingleThreadedDataSourceBase类。同样，可以通过调用readRecords()方法来实现多分片多路复用。
---实时计算 Flink版产品文档

2023-12-29 15:36:12

赞同展开评论

Flink 模式下多分分片多路读 batch模式就是多分片多路复用了这是哪里有设置么？

实时计算 Flink

相关文章

热门讨论

热门文章

Flink 模式下多分分片多路读 batch模式就是多分片多路复用了 这是哪里有设置么？

实时计算 Flink

相关文章

热门讨论

热门文章

Flink 模式下多分分片多路读 batch模式就是多分片多路复用了这是哪里有设置么？