备案控制台

开发者社区问答正文

flink dataset 分组后如何实现内容拼接呢？

col1 col2 pid

1.0 2.0 1

2.0 2.0 1

1.0 2.0 1

3.0 2.0 1

1.0 2.0 1

1.0 2.0 2

1.0 2.0 2

1.0 2.0 2

1.0 2.0 2

1.0 2.0 2 各位大神，想问一下利用flink dataset 对pid 列进行分组，然后对分组后的col1列的内容进行拼接，如1.0#2.0#1.0#3.0.... 请问大家这个该怎么实现？*来自志愿者整理的FLINK邮件归档

展开

收起

又出bug了-- 2021-12-03 17:31:09 627 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

CCCC

可以这样写

ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment(); env.fromElements(Tuple3.of(1.0, 2.0, 1), Tuple3.of(2.0, 2.0, 1),Tuple3.of(3.0,2.0,1), Tuple3.of(1.0, 2.0, 2), Tuple3.of(2.0, 2.0, 2),Tuple3.of(3.0,2.0,2)) .map((MapFunction<Tuple3<Double, Double, Integer>, Tuple3<String, Double, Integer>>) t -> Tuple3.of(String.valueOf(t.f0), t.f1, t.f2)).groupBy(2) .reduce((ReduceFunction<Tuple3<String, Double, Integer>>) (tuple, t1) -> Tuple3.of(tuple.f0 + "#" + t1.f0, tuple.f1, tuple.f2)).print(); env.execute(); 结果： (1.0#2.0#3.0,2.0,1) (1.0#2.0#3.0,2.0,2)*来自志愿者整理的FLINK邮件归档

2021-12-03 17:58:48

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版dataset 实时计算 Flink版分组实时计算 Flink版拼接

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Flink，对mysql cdc作为数据源的动态表进行over分组聚合操作的时候，是什么原因？

937

2

0

Flink CDC想从上一个savepoint启动还需要设置 SET 吗？

312

2

0

通过flink的SQL作业生成的宽表的数据结果，跟拼接代码在holo里跑出来的查询结果不一致为什么？

138

0

0

Flink这个server_id 能通过 set 的方式全局配置吗？

70

1

0

请教flink专家，同一个partition下的数据，如果分组键变化是否会引发乱序？

229

9

0

请问flink动态cep中能支持规则分组吗？

115

1

0

Flink这个示例的分组边界是怎么定义的呢？

97

1

0

Flink能否像通过set增加表属性

88

1

0

我这边flink sql任务设置了SET 请问怎么还是全量读取数据呢?

236

6

0

"Flink中datastream分组后开了窗，为什么16048和16049的窗口没了呢？

82

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

12月冬日咖啡礼｜大模型解决方案邀你来体验

相关文章

Apache Flink 2.2.0: 推动实时数据与人工智能融合，赋能AI时代的流处理

Forrester发布流式数据平台报告：Flink 创始团队跻身领导者行列，实时AI能力获权威认可

别再把数据管道当“体力活”了：从单体任务到事件驱动的升级之路

《构建游戏实时流失预警模型的核心逻辑》

别再全量拉表了兄弟：一篇讲透增量数据处理与 CDC 的实战指南

还有其他疑问?