kettle开发篇-批量读取EXCEL文件

简介: 笔记

前言:


虽然目前我们大多数数据从数据库取数或者爬虫获取了,但是有些情况下我们需要对经营数据进行加工,这些数据只能给部分管理者查看,因此需要单独建立经营分析的库来存储手工的数据,而能大批量处理手工数据的地方,避免不了要去接触EXCEL。EXCEL作为办公软件的三剑客,在日常工作中出场率也太高了吧。下面来介绍怎么批量获取我们需要的数据。


一、批量获取数据的前提条件


1、公共的字段名

竟然是批量获取数据,当然这些数据的列名,基本上是长一样,这样我们才能批量将相似的数据存到对应的同一个表里面,然后用于经营分析。比如我们获取10个月的用电数据,然后这10个月的电费是分为10个EXcel存储的。EXCEL中的列名分别是用电日期、用电单位、用电度数、电价、电费。当然我们可以因为需要的改变,可以在第8 9 10个月的EXCEL表中增加抄表人、确认时间等。但他们主体都是前面说到的用电日期、用电单位、用电度数、电价、电费,只是我们的底表需要多增加两个字段来存储抄表人、确认时间。

2、相同的开始行

这个是因为,我们需要获取对应的列名做为数据流来传递数据,如果我们的列名有的存储在第一行、有的在第二行等等,此时就会因为获取不到列名导致读取数据失败。


二、批量读取EXCEL程序


转换一共包括三步,获取文件名-EXCEL输入-表输出

5.png

1、获取文件名

这一步包括指定批量获取EXCEL文件存储的位置,如图所示文件存储在D:\etl\excel_loop,然后过滤任何是EXCEL的文件,如.*.xlsx通配符为获取该文件夹下面所有的EXCEL表名。

6.png

如图所示,或者EXCEL_LOOP下面的test1/test2/test3的文件数据。

7.png

2、EXCEL输入

这个步骤主要通过前面传输过来的表名来获取对应的数据,需要注意的是,在这一步需要选择一个EXCEL来指定获取的字段名称和获取的是哪个sheet的数据。如下图所示。

image.pngimage.png

3、表输出

表输出和其他步骤都是一样的没有什么特殊的操作,到这一步就完成了EXCEL的批量获取数据了,是不是非常的简单,不需要写一行代码,只需要懂通配符的语法即可。

image.png


相关文章
|
2天前
R Excel 文件
Excel 格式的文件主要是 xls 或 xlsx,这两种文件可以在 R 语言中导入 xlsx 库来实现直接的读取。
33 23
|
1月前
|
前端开发 JavaScript
使用Vue+xlsx+xlsx-style实现导出自定义样式的Excel文件
本文介绍了在Vue项目中使用`xlsx`和`xlsx-style`(或`xlsx-style-vite`)库实现导出具有自定义样式的Excel文件的方法,并提供了详细的示例代码和操作效果截图。
274 1
使用Vue+xlsx+xlsx-style实现导出自定义样式的Excel文件
|
1月前
|
前端开发 Python
使用Python+openpyxl实现导出自定义样式的Excel文件
本文介绍了如何使用Python的openpyxl库导出具有自定义样式的Excel文件,包括设置字体、对齐方式、行列宽高、边框和填充等样式,并提供了完整的示例代码和运行效果截图。
28 1
使用Python+openpyxl实现导出自定义样式的Excel文件
|
1月前
|
Python
python生成excel文件的三种方式
python生成excel文件的三种方式
45 1
python生成excel文件的三种方式
|
2天前
|
存储 数据挖掘 测试技术
Python接口自动化中操作Excel文件的技术方法
通过上述方法和库,Python接口自动化中的Excel操作变得既简单又高效,有助于提升自动化测试的整体质量和效率。
10 0
|
24天前
|
SQL JSON 关系型数据库
n种方式教你用python读写excel等数据文件
n种方式教你用python读写excel等数据文件
|
1月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何直接导出excel文件
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
1月前
|
JavaScript 前端开发 easyexcel
基于SpringBoot + EasyExcel + Vue + Blob实现导出Excel文件的前后端完整过程
本文展示了基于SpringBoot + EasyExcel + Vue + Blob实现导出Excel文件的完整过程,包括后端使用EasyExcel生成Excel文件流,前端通过Blob对象接收并触发下载的操作步骤和代码示例。
182 0
基于SpringBoot + EasyExcel + Vue + Blob实现导出Excel文件的前后端完整过程
|
1月前
|
文字识别 C# Python
使用C#将几个Excel文件合并去重分类
使用C#将几个Excel文件合并去重分类
21 3
|
1月前
|
关系型数据库 MySQL Windows
MySQL数据导入:MySQL 导入 Excel 文件.md
MySQL数据导入:MySQL 导入 Excel 文件.md