kettle开发篇-行转列

简介: kettle开发篇-行转列

前言:


在前面我们讲到了拆分字段、去除重复记录、获取哈希值、列转行等,都是针对EXCEL的数据的操作,在昨天写完列转行时,有人提问到,能不能两级反转,来说说行转列。好的,今天我们就来详细说明下行转列的操作,我们还是应用昨天的数据,但是将EXCEL输出变成今天的输入,通过行转列完成两级反转。


一、行转列


如图所示,行转列就是把数据字段的字段名转换为一列,把数据行变成数据列。即我们将昨天输出的张三在周一至周日的工作小时转换为7行数据。对应7行数据分别为张三在周一工作多个小时,在周二工作多少个小时等等。

我们来看下行转列组件的关键语法,行转列包括关键的Key字段即转换后的列名,然后通过字段名称周一至周日与key值匹配对应,最后将原列名周一至周日对应的数字,全部对应一个新的字段即工作小时,这样我们就完成了行转列的基本操作了。


二、实战操作


我们根据任务的要求从EXCEL读取数据,把星期工作小时转为星期列和工作小时列,把数据保持至EXCEL中。

最终我们完成的转换包括EXCEL输入、行转列、EXCEL输出三个组件,其中EXCEL输入和EXCEL输出在前面已经重复了多次了,如果还不清楚可以看下往期的文章。具体EXCEL输入主要包括,要输入的EXCEL的位置,然后获取对应字段,EXCEL输出为指定EXCEL输出保存的位置,然后获取对应EXCEL输出的位置。其中行转列,我们根据上面说的语法,配置对应key字段、字段名称、Key值、Value值。然后运行转换即可在我们EXCEL输出位置获取到我们的结果。

相关文章
|
6月前
|
数据采集 前端开发 数据挖掘
kettle开发-SQ索引优化
kettle开发-SQ索引优化
115 0
|
6月前
|
数据库连接 数据库
kettle开发篇-数据库查询
kettle开发篇-数据库查询
128 0
|
6月前
kettle开发篇-空操作
kettle开发篇-空操作
117 0
|
25天前
|
SQL 关系型数据库 Shell
SQL整库导出语录及其实用技巧与方法
在数据库管理和备份恢复过程中,整库导出是一项至关重要的任务
|
SQL 数据处理 数据库
时序数据库 TDengine SQL 查询语法规则汇总,官方教程奉上!
TDengine 采用 SQL 作为查询语言,本文将就部分查询细则做分析。
524 1
|
6月前
|
SQL 数据挖掘 数据库
SQL数据分析实战:从导入到高级查询的完整指南
SQL数据分析实战:从导入到高级查询的完整指南
149 0
|
6月前
|
存储
kettle开发篇-列转行
kettle开发篇-列转行
233 0
|
6月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
152 0
|
6月前
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
265 0
|
SQL 分布式计算 数据管理
聊聊Hive数据血缘——从Atlas没有列级血缘的Bug讲起
聊聊Hive数据血缘——从Atlas没有列级血缘的Bug讲起
216 0