kettle开发篇-拆分字段

简介: 笔记

前言:


前面我们有讲到合并字段,将firstname和lastname合并为姓名,今天我们来讲解怎么将一个字段拆分为多个字段,怎么将一列数据转换为多行。拆分字段的用处比如前面提到的获取firstname 和 lastname,也可用于从批次号中获取型号等。如约翰-詹姆斯,我们按照“-”进行拆分就得到我们想要的约翰、詹姆斯了。同样的在批次号WZ20221211_HZN502我们通过“_”拆分后就获得了我们需要的型号HZN502了。今天我们按照惯例还是以EXCEL为案例来演示具体执行过程。


一、拆分字段


1、拆分字段就是将一个字段拆分为多个字段,原字段就不存在数据流之中,拆分的规则是按照一个的分隔符进行拆分。具体语法如下图所示。

60.png

2、实操将EXCEL中name拆分为firstname 和 lastname,具体转换包括EXCEL输入、拆分字段、EXCEL输出。

62.png

EXCEL输入还是和以前一样,选择EXECL表,指定字段。


63.png

拆分字段,我们先选择要拆分的字段,然后选择拆分符为-,然后输入两个新字段的名称分别为firstname 和 lastname并指定对应字段类型为string类型。

64.png

EXCEL输出还是和以前一样,选择EXCEL输出的位置,点击运行转换,查看运行结果,如图所示我们看到我们将原来的name字段拆分为了firstname和lastname这两个新字段,功能还是非常强大的,但是我们需要注意的是原来字段就不存在数据流中,因此我们输出的EXCEL中就不存在原来name字段的值。

最后我们在我们的EXCEL表输出中,看到了我们需要的firstname 和 lastname两列的值。真的比较简单,快去试试吧。

image.pngimage.png


相关文章
|
6月前
|
数据库
kettle开发篇-合并记录
kettle开发篇-合并记录
228 0
|
4月前
|
存储 SQL 缓存
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
MySQL设计规约问题之为什么要将大字段、访问频率低的字段拆分到单独的表中存储
|
4月前
|
Kubernetes 关系型数据库 MySQL
实时计算 Flink版操作报错合集之一张大表主键是多个字段组成的,按第一个主键的column划分出现了数据倾斜,该如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
5月前
|
SQL 关系型数据库 数据处理
实时计算 Flink版产品使用问题之在同步数据时,是否可以使用正则表达式匹配进行源表到目标表的分库分表同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
5月前
|
分布式计算 关系型数据库 数据挖掘
实时数仓 Hologres产品使用合集之如果采用组合主键,比如id + 时间时间(字符串),做为组合主键后是否会导致数据倾斜呢
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
6月前
|
存储 SQL 数据管理
平台设计-固定表结构与可自定义表结构
整个平台的表结构分为两种:固定的和可自定义的。
|
6月前
|
存储
kettle开发篇-列拆分为多行
kettle开发篇-列拆分为多行
265 0
|
6月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
152 0
|
6月前
|
Oracle 关系型数据库
kettle开发篇-替换空值
kettle开发篇-替换空值
276 0
|
应用服务中间件 Linux 索引
42分布式电商项目 - 修改索引库名称
42分布式电商项目 - 修改索引库名称
61 0