开发者社区问答正文

Flink1.12 批处理模式，分词统计时单词个数为1的单词不会被打印怎么处理？

代码： val env = StreamExecutionEnvironment.getExecutionEnvironment

env.setRuntimeMode(RuntimeExecutionMode.BATCH) // 在DataStream API上以批处理方式执行

// 本地测试文件 val inputStream = env.readTextFile(getClass.getResource("/hello.txt").getPath)

// 分词统计，问题：批处理模式的时候，sum 为 1 的单词不会被打印 val resultStream = inputStream .flatMap(.split(",")) .filter(.nonEmpty) .map((, 1)) .keyBy(._1) .sum(1) resultStream.print() env.execute("word count")

测试文件的数据内容： hello,flink hello,flink hello,hive hello,hive hello,hbase hello,hbase hello,scala hello,kafka hello,kafka

测试结果：hello/flink/hive/hbase/kafka的和大于1，会打印出来；但是 scala的个数为1，不会被打印出来*来自志愿者整理的flink邮件归档

展开

收起

JACKJACK 2021-12-08 10:57:23 995 版权

1 条回答

写回答

取消提交回答

全云坠旺的仔

对的是我！

你用的应该是 1.12.0 版本吧。这是一个已知问题，升级到 1.12.1 有修复。*来自志愿者整理的flink邮件归档

2021-12-08 11:17:17

赞同展开评论

问答分类：

SQL 消息中间件自然语言处理 Kafka 分布式数据库 API Scala HIVE 流计算 Hbase 实时计算 Flink版云消息队列 Kafka 版云数据库HBase版

问答标签：

实时计算 Flink版模式实时计算 Flink版批处理实时计算 Flink版统计实时计算 Flink版批处理模式实时计算 Flink版分词

问答地址：

开发者社区 > 数据库 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Flink1.12 批处理模式，分词统计时单词个数为1的单词不会被打印怎么处理？

相关文章