前言
开发中经常会涉及到excel的处理,如导出Excel到数据库中,读取Excel内容!操作Excel目前比较流行的就是Apache POI和阿里巴巴的easyExcel
将用户信息导出为excel表格
讲Excel表中的信息录入到网站数据库,大大减小网站数据的录入量!
一、Apache POI是什么?
Apache POI官网: https://poi.apache.org/
二、EasyExcel是什么?
官方文档: https://www.yuque.com/easyexcel/doc/easyexcel
EasyExcel是阿里巴巴开源的一个excel处理框架,以使用简单,节约内存著称。
优势:EasyExcel能大量减少占用内存的主要原因是在解析Excel时没有将文件数据一次性全部加载到内存中,而是从一个磁盘上一行行读取数据,逐个解析。
下图是EasyExcel和POI在解析Excel时的对比图(时间与空间的相互取舍)。
三、Apache POI操作?
HSSF:Excel97-2003版本,扩展名为.xls。一个sheet最大行数65536,最大列数256。
XSSF:Excel2007版本开始,扩展名为.xlsx。一个sheet最大行数1048576,最大列数16384。
SXSSF:是在XSSF基础上,POI3.8版本开始提供的支持低内存占用的操作方式,扩展名为.xlsx。
1.POI写操作
创建一个普通空项目empty model,然后新建一个model的maven项目
引入pom依赖
<!--导入依赖--> <dependencies> <!--xLs(03)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi</artifactId> <version >3.9</version> </dependency> <!--xLsx(07)--> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.9</version> </dependency> <!--日期格式化工具--> <dependency> <groupId>joda-time</groupId> <artifactId>joda-time</artifactId> <version>2.10.1</version> </dependency> <!--test--> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.12</version> </dependency> </dependencies>
注:03|07版本的写,就是对象不同,方法是一样的
区别:03版最多65536行,07行数没有限制 ,03 HSSFWorkbook() 后缀xls,07 XSSFWorkbook() 后缀xlsx,
工作薄
工作表
行
单元格
03版本
package com.kuang; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.joda.time.DateTime; import org.junit.Test; import java.io.FileOutputStream; import java.io.IOException; import java.util.Date; public class ExcelWriteTest { String PATH="ExcelCreate\\"; @Test public void testWrite03() throws IOException { //1,创建一个工作簿 Workbook workbook = new HSSFWorkbook(); //2,创建一个工作表 Sheet sheet = workbook.createSheet("03统计表"); //3,创建一行(1,1) Row row1 = sheet.createRow(0); //4,创建一个单元格 Cell cell11 = row1.createCell(0); cell11.setCellValue("新增观众"); //(1,2) Cell cell12 = row1.createCell(1); cell12.setCellValue(666); //第二行(2,1) Row row2 = sheet.createRow(1); Cell cell21 = row2.createCell(0); cell21.setCellValue("时间记录"); //(2,2) Cell cell22 = row2.createCell(1); cell22.setCellValue(new DateTime().toString("yyyy-MM-dd HH:mm:ss")); //生成一张表(IO流)03版本使用xls结尾! FileOutputStream fileOutputStream = new FileOutputStream(PATH + "03版本测试.xls"); //输出 workbook.write(fileOutputStream); //关闭流 fileOutputStream.close(); System.out.println("03生成成功"); } }
运行结果
07和03不同的就这两处:注意对象的一个区别,文件后缀!
//创建对象用XSSF Workbook workbook = new XSSFWorkbook(); //生成一张表(IO流)07版本使用xlsx结尾! FileOutputStream fos = new FileOutputStream(PATH+"07版本Excel测试.xlsx"); 注:大文件写用HSSF
缺点:最多只能处理65536行,否则会报异常
优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快
java.lang.IllegalArgumentException:Invalid row number (65536) outside allowable range (0.. 65535) @Test public void testwrite03BigData() throws IOException { //时间 long begin = System.currentTimeMillis(); //创建一个薄 Workbook workbook = new HSSFWorkbook(); //创建表 Sheet sheet = workbook.createSheet(); //写入数据 for (int rowNum = 0; rowNum < 65536; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } FileOutputStream fos = new FileOutputStream(PATH + "03版本Excel大量数据测试.xls"); workbook.write(fos); fos.close(); System.out.println("over"); long end = System.currentTimeMillis(); System.out.println((double) (end - begin) / 1000); }
运行结果
over 3.057
大文件写用XSSF
缺点:写数据时速度非常慢,非常耗内存,也会发生内存溢出,如100万条数据
优点:可以写较大的数据量,如20万条数据
Workbook workbook = new XSSFWorkbook(); Fileoutputstream ops = new Fileoutputstream(PATH +"07版本Excel大量数据测试.xlsx");
大文件写用SXSSF
SXSSWorkbook 来自官方解释:实现:BigGridDemo策略的流式XSSFWorkbook版本。这允许写入非常大的文件而不会耗尽内存,因为任何时候只有可配置的行部分被保存在内存中。
读取07及以上版本的excel仍然是“XSSFWorkbook”,写入则为“SXSSFWorkbook ”。后缀和07一样是.xlsx。
最后调用workbook.dispose()删除临时文件。
优点:可以写非常大量的数据库,如100万条甚至更多条,写数据速度快,占用更少的内存
注意:
过程中会产生临时文件,需要清理临时文件
默认由100条记录被保存在内存中,如果超出这数量,则最前面的数据被写入临时文件
如果想自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)
Workbook workbook = new SXSSFWorkbook(); Fileoutputstream ops = new Fileoutputstream(PATH +"07版本Excel大量数据测试.xlsx"); @Test public void testwrite07_S_BigData() throws IOException { //时间 long begin = System.currentTimeMillis(); //创建一个薄 Workbook workbook = new SXSSFWorkbook(100); //创建表 Sheet sheet = workbook.createSheet(); //写入数据 for (int rowNum = 0; rowNum < 65536; rowNum++) { Row row = sheet.createRow(rowNum); for (int cellNum = 0; cellNum < 10; cellNum++) { Cell cell = row.createCell(cellNum); cell.setCellValue(cellNum); } } FileOutputStream fos = new FileOutputStream(PATH + "07_S_版本Excel大量数据测试.xlsx"); workbook.write(fos); fos.close(); //清除临时缓存 ((SXSSFWorkbook)workbook).dispose(); System.out.println("over"); long end = System.currentTimeMillis(); System.out.println((double) (end - begin) / 1000); }
2.POI-Excel读
03类型
package com.kuang; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.junit.Test; import java.io.FileInputStream; public class ExcelReadTest { String PATH = "ExcelCreate\\"; @Test public void testRead03() throws Exception { //获取文件流 FileInputStream fis = new FileInputStream(PATH + "03版本测试.xls"); //1、创建一个工作簿。使用 exceL能操作的这边他都可以操作! Workbook workbook = new HSSFWorkbook(fis); //2、得到表 Sheet sheet = workbook.getSheetAt(0); //3、得到行 Row row = sheet.getRow(0); //4、得到列 Cell cell = row.getCell(1); //读取值的时候,一定要注意类型! //getStringCellValue 字符串类型 System.out.println(cell.getNumericCellValue()); fis.close(); } }
07类型
@Test public void testRead07() throws Exception { //获取文件流 FileInputStream fis = new FileInputStream(PATH + "07版本测试.xlsx"); //1、创建一个工作簿。使用 exceL能操作的这边他都可以操作! Workbook workbook = new XSSFWorkbook(fis); //2、得到表 Sheet sheet = workbook.getSheetAt(0); //3、得到行 Row row = sheet.getRow(0); //4、得到列 Cell cell = row.getCell(0); //读取值的时候,一定要注意类型! //getStringCellValue 字符串类型 System.out.println(cell.getStringCellValue()); fis.close(); } 注:获取值的类型即可,读取不同的数据类型 @Test public void testCellType() throws Exception { //获取文件流 FileInputStream fis = new FileInputStream(PATH +"课题信息表20190701.xlsx"); //创建一个工作簿。使用 excel能操作的这边他都可以操作 Workbook workbook = new XSSFWorkbook(fis); Sheet sheet = workbook.getSheetAt(0); //获取标题内容 Row rowTitle = sheet.getRow(0); if (rowTitle != null) { //得到一行有多少列有数据 int cellCount = rowTitle.getPhysicalNumberOfCells(); for (int cellNum = 0; cellNum < cellCount; cellNum++) { Cell cell = rowTitle.getCell(cellNum); if (cell != null) { int cellType = cell.getCellType(); String cellValue = cell.getStringCellValue(); System.out.print(cellValue + "|"); } } System.out.println(); } //获取表中的内容 //获取表中有多少行有数据 int rowCount = sheet.getPhysicalNumberOfRows(); for (int rowNum = 1; rowNum < rowCount; rowNum++) { Row rowData = sheet.getRow(rowNum); if (rowData != null) { //读取列 int cellCount = rowTitle.getPhysicalNumberOfCells(); for (int cellNum = 0; cellNum < cellCount; cellNum++) { System.out.println("[" + (rowNum + 1) + "-" + (cellNum + 1) + "]"); Cell cell = rowData.getCell(cellNum); //匹配列的数据类型 if (cell != null) { int cellType = cell.getCellType(); String cellValue = ""; switch (cellType) { case HSSFCell.CELL_TYPE_STRING://字符 System.out.print("【 String】"); cellValue = cell.getStringCellValue(); break; case HSSFCell.CELL_TYPE_BOOLEAN://布尔 System.out.print("【 BOOLEAN】"); cellValue = String.valueOf(cell.getBooleanCellValue()); break; case HSSFCell.CELL_TYPE_BLANK://空 System.out.print("【 BLANK】"); break; case HSSFCell.CELL_TYPE_NUMERIC://数字(日期、普通数字) System.out.print("【 NUMERIC】"); if (HSSFDateUtil.isCellDateFormatted(cell)) {// 日期 System.out.print("--【日期】"); Date date = cell.getDateCellValue(); cellValue = new DateTime(date).toString("yyyy-MM-dd"); } else { //不是日期格式,防止数字过长! System.out.print("--【转换为字符串输出】"); cell.setCellType(HSSFCell.CELL_TYPE_STRING); cellValue = cell.toString(); } break; case HSSFCell.CELL_TYPE_ERROR://错误 System.out.print("【 数据类型错误】"); break; } System.out.println(cellValue); } } } } //关闭流 fis.close(); } 计算公式(了解) @Test public void testFormula() throws Exception { FileInputStream fis = new FileInputStream(PATH+"公式.xls"); //创建一个工作簿。使用 excel能操作的这边他都可以操作 Workbook workbook = new HSSFWorkbook(fis); Sheet sheet = workbook.getSheetAt(0); Row row = sheet.getRow(4); Cell cell = row.getCell(0); //拿到计算公司 evaL FormulaEvaluator FormulaEvaluator = new HSSFFormulaEvaluator((HSSFWorkbook) workbook); //输出单元格的内容 int cellType = cell.getCellType(); switch (cellType) { case Cell.CELL_TYPE_FORMULA://公式 String formula = cell.getCellFormula(); System.out.println(formula); //计算 CellValue evaluate = FormulaEvaluator.evaluate(cell); String cellValue = evaluate.formatAsString(); System.out.println(cellValue); break; } }
运行结果
SUM(A2:A4) 600.0