使用EasyExcel导入导出Excel报表-JAVA解析Excel工具

简介: 使用EasyExcel导入导出Excel报表-JAVA解析Excel工具

一、EasyExcel概述

 

Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。easyexcel重写了poi对07版Excel的解析,能够原本一个3M的excel用POI sax依然需要100M左右内存降低到几M,并且再大的excel不会出现内存溢出,03版依赖POI的sax模式。在上层做了模型转换的封装,让使用者更加简单方便。

github地址:GitHub - alibaba/easyexcel: 快速、简洁、解决大文件内存溢出的java处理Excel工具

使用文档:https://alibaba-easyexcel.github.io/

官方给出的数据,64M内存1分钟内读取75M(46W行25列)的Excel,当然还有急速模式能更快,但是内存占用会在100M多一点:

image.gif编辑

二、EasyExcel常用功能

读Excel

    写Excel

      填充Excel

        三、EasyExcel使用方法和调优

        官方除了文档外,还提供了强大的demo代码。代码就不贴了,我只给出maven坐标:

        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>easyexcel</artifactId>
            <version>2.1.4</version>
        </dependency>

        image.gif

        默认大文件处理

        默认大文件处理会自动判断,共享字符串5M以下会使用内存存储,大概占用15-50M的内存,超过5M则使用文件存储,然后文件存储也要设置多内存M用来存放临时的共享字符串,默认20M。除了共享字符串占用内存外,其他占用较少,所以可以预估10M,所以默认大概30M就能读取一个超级大的文件。

        根据实际需求配置内存

        四、EasyExcel的核心原理

        1、文件解压文件读取通过文件形式

        网络异常,图片无法展示
        |
        image.gif 编辑

        2、避免将全部全部数据一次加载到内存

        采用sax模式一行一行解析,并将一行的解析结果以观察者的模式通知处理。

        网络异常,图片无法展示
        |
        image.gif 编辑

        3、抛弃不重要的数据

        Excel解析时候会包含样式,字体,宽度等数据,但这些数据是我们不关心的,如果将这部分数据抛弃可以大大降低内存使用。Excel中数据中Style占了相当大的空间。

        五、该项目的优缺点

        该项目不是阿里重点项目,目前只有三个人维护,但项目很活跃,获得的star数也很高,可以作为生产来使用。但要注意,目前还有以下功能尚未实现:

          • 单个文件的并发写入、读取
          • 读取图片
          • csv读取(这个后续可能会考虑)
          相关文章
          |
          2月前
          |
          存储 人工智能 算法
          从零掌握贪心算法Java版:LeetCode 10题实战解析(上)
          在算法世界里,有一种思想如同生活中的"见好就收"——每次做出当前看来最优的选择,寄希望于通过局部最优达成全局最优。这种思想就是贪心算法,它以其简洁高效的特点,成为解决最优问题的利器。今天我们就来系统学习贪心算法的核心思想,并通过10道LeetCode经典题目实战演练,带你掌握这种"步步为营"的解题思维。
          |
          2月前
          |
          存储 安全 Java
          《数据之美》:Java集合框架全景解析
          Java集合框架是数据管理的核心工具,涵盖List、Set、Map等体系,提供丰富接口与实现类,支持高效的数据操作与算法处理。
          |
          3月前
          |
          Java 开发者
          Java 函数式编程全解析:静态方法引用、实例方法引用、特定类型方法引用与构造器引用实战教程
          本文介绍Java 8函数式编程中的四种方法引用:静态、实例、特定类型及构造器引用,通过简洁示例演示其用法,帮助开发者提升代码可读性与简洁性。
          |
          3月前
          |
          Java 开发者
          Java并发编程:CountDownLatch实战解析
          Java并发编程:CountDownLatch实战解析
          469 100
          |
          3月前
          |
          机器学习/深度学习 JSON Java
          Java调用Python的5种实用方案:从简单到进阶的全场景解析
          在机器学习与大数据融合背景下,Java与Python协同开发成为企业常见需求。本文通过真实案例解析5种主流调用方案,涵盖脚本调用到微服务架构,助力开发者根据业务场景选择最优方案,提升开发效率与系统性能。
          873 0
          |
          3月前
          |
          安全 Java API
          Java SE 与 Java EE 区别解析及应用场景对比
          在Java编程世界中,Java SE(Java Standard Edition)和Java EE(Java Enterprise Edition)是两个重要的平台版本,它们各自有着独特的定位和应用场景。理解它们之间的差异,对于开发者选择合适的技术栈进行项目开发至关重要。
          460 1
          |
          3月前
          |
          Java
          Java的CAS机制深度解析
          CAS(Compare-And-Swap)是并发编程中的原子操作,用于实现多线程环境下的无锁数据同步。它通过比较内存值与预期值,决定是否更新值,从而避免锁的使用。CAS广泛应用于Java的原子类和并发包中,如AtomicInteger和ConcurrentHashMap,提升了并发性能。尽管CAS具有高性能、无死锁等优点,但也存在ABA问题、循环开销大及仅支持单变量原子操作等缺点。合理使用CAS,结合实际场景选择同步机制,能有效提升程序性能。
          |
          2月前
          |
          JSON 网络协议 安全
          【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
          几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
          193 1
          |
          2月前
          |
          JSON 网络协议 安全
          【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
          几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
          215 1
          |
          3月前
          |
          数据采集 存储 弹性计算
          高并发Java爬虫的瓶颈分析与动态线程优化方案
          高并发Java爬虫的瓶颈分析与动态线程优化方案

          推荐镜像

          更多
        • DNS