JUC是 java.util.concurrent 这个包的简写,其中存放了Java并发框架为协调并发任务所提供的一些工具。本文介绍其中的Executors、ThreadPoolExecutor类。
在Java中,xx池的概念是很常见的,比如之前遇到过的常量池、数据库连接池等等。线程池是一种常用的多线程处理方式,它可以重复利用已创建的线程,从而减少线程的创建和销毁开销,并提高程序的性能。
构造一个新的线程开销有些大,因为这涉及与操作系统的交互。如果你的程序中创建了大量的生命期很短的线程,那么不应该把每个任务映射到一个单独的线程,而应该使用线程池(thread pool)。线程池中包含许多准备运行的线程。为线程池提供一个 Runnable,就会有一个线程调用 run 方法。当run 方法退出时,这个线程不会死亡,而是留在池中准备为下一个请求提供服务。
通俗来说,线程池就是提前把线程准备好。当有任务要执行时,原本我们会直接创建一个线程(从系统申请一个线程的资源),然后让这个线程来执行这个任务。但有了线程池后,创建线程不是直接从系统申请,而是从池子里拿;线程不用了,也是还给池子。
池存在的目的是为了提高效率。线程的创建虽然比进程轻量,但是在频繁创建的情况下,开销也是不可忽略的。
线程池最大的好处就是减少了每次启动、销毁线程的损耗。
其实解决频繁创销线程带来的开销这个问题,可以用线程池,也可以用协程。协程是轻量级的线程,不过Java的标准库还不支持(Java只在第三方库的层面上支持协程)。
一、为什么从线程池中获取线程更高效?
为什么从池子里拿线程要比从系统创建线程更高效?
这是因为,从人程池拿线程是纯粹的用户态操作;而从系统创建线程,就涉及到用户态和内核态之间的切换(真正的创建是要在内核态完成的)。
用户态、内核态是操作系统中的基本概念。
一个操作系统 = 内核 + 配套的应用程序
内核是操作系统最核心的功能模块的集合,如硬件管理,各种驱动,进程管理,内存管理,文件系统等等。这个内核要给上层的应用程序提供支持。比如在显示器上打印hello的操作: println("hello"),应用程序就要调用系统内核,告诉内核我要进行一个打印字符串操作,内核再通过驱动程序操作显示器,完成上述功能。
然而,同一时刻应用程序可能有很多,但内核始终只有一个。内核又要给这么多程序提供服务,这就导致了有的时候服务不一定那么及时。
想象一个银行的工作场景:
这里的柜台内部就相当于内核态,而大厅相当于用户态。
有个办业务的滑稽大哥和柜台的工作人员说,想办一张银行卡,但却发现没有带身份证复印件。这时,工作人员给了他两个方案:要么自己拿着身份证到大厅的复印机复印,要么把身份证交给工作人员,由工作人员在柜台内的复印机复印。
这两种方式在效率上是有差别的:
1、如果自己去复印,快去快回,复印完之后立即就回来了。
2、如果由工作人员复印,他可能去复印的同时还顺便干点别的,比如喝口水,上个厕所,完成一下上级给的别的任务,和同事唠唠嗑……最终确实也能给滑稽大哥复印,但可能就没那么及时了。
总结起来就是,纯用户态的操作,时间是可控的;但涉及到内核态操作,时间就不太可控了。
⭐线程池的优点
降低资源消耗:减少线程的创建和销毁带来的性能开销。
提高响应速度:当任务来时可以直接使用,不用等待线程创建。
可管理性: 进行统一的分配,监控,避免大量的线程间因互相抢占系统资源导致的阻塞现象。
二、Java标准库中的线程池 ExecutorService
ExecutorService是 Java 中用于管理和执行异步任务的接口,它是一个高级的线程池管理工具,继承自 Executor 接口。ExecutorService 接口定义了一组方法,可以用于提交任务、执行任务、关闭线程池等。
执行任务:
execute(Runnable task):执行一个 Runnable 任务。
提交任务:可用下面的方法之一将Runnable或 Callable对象提交给ExecutorService,线程池会在方便的时候尽早执行提交的任务。调用submit 时,会得到一个 🔗Future 对象,可用来得到结果或者取消任务:
Future submit(Callable task):提交一个 Callable 任务给线程池执行。
Future submit(Runnable task, T result):提交一个 Runnable 任务给线程池执行。(也生成一个Future,它的 get 方法在完成的时候返回指定的 result 对象。)
Future submit(Runnable task):返回一个看起来有些奇怪的 Future。可以使用这样一个对象来调用isDone、cancel或isCancelled。但是,get 方法在完成的时候只是简单地返回 null。
使用完一个线程池时,调用:
shutdown():启动线程池的关闭序列,平缓地关闭线程池,被关闭的执行器不再接受新的任务,允许已经提交的任务执行完毕。当所有任务都完成时,线程池中的线程死亡。
shutdownNow():立即关闭线程池,尝试中断正在执行的任务,取消所有尚未开始的任务。
通过使用 ExecutorService,我们可以将任务提交给线程池,由线程池自动分配和执行任务。线程池会管理线程的创建、复用和销毁,使多线程任务的执行更高效可控。
1、Executors执行器类 & 线程池的创建
执行器(Executors)类有许多静态工厂方法,用来构造线程池。这些方法返回 ExecutorService 接口 或 ScheduledExecutorService 接口的实例,即线程池实例。ExecutorService 也提供了一些提交任务和管理线程池的方法,如submit()、shutdown()等。
(1)调用Executors类静态工厂方法创建线程池
使用 Executors执行器类 可以方便地创建和管理线程池,实现多线程编程以及控制线程的执行方式、数量和生命周期。
以下是创建线程池的代码示例:创建好线程池后,通过pool.submit()方法,向线程池中注册任务。
//创建线程池 ExecutorService pool = Executors.newFixedThreadPool(10); //添加任务到线程池中 pool.submit(() -> { System.out.println("hello"); });
- 使用 Executors.newFixedThreadPool(10) 能创建出固定包含 10 个线程的线程池pool。
- 返回值类型为 ExecutorService,是Java标准库中所提供的线程池接口。
- 通过 ExecutorService.submit() 可以注册一个任务到线程池中。
Executors执行器类提供的各种静态工厂方法可以用于创建不同类型的线程池,常用的方法有:
newFixedThreadPool(int nThreads):创建一个固定大小的线程池,该线程池中最多同时执行nThreads个任务。如果提交的任务数多于空闲线程数,就把未得到服务的任务放到阻塞队列中。当其他任务完成以后再运行这些排队的任务。
newCachedThreadPool():构造一个线程池,会立即执行各个任务,如果有空闲线程可用,就使用现有空闲线程执行任务;如果没有可用的空闲线程,则创建一个新线程。
newSingleThreadExecutor():创建只包含单个线程的线程池。由一个线程顺序地执行所提交的任务(一个接着一个执行)。
newScheduledThreadPool(int corePoolSize):创建一个固定大小的线程池,该线程池可以安排任务在指定延迟后执行,或定期执行,是进阶版的 Timer。它返回一个ScheduledExecutorService 接口的实例。
图片来自《Java核心技术卷·Ⅰ》
不同方法创建出的线程池具有不同的特性。这些特性决定了当外部线程向线程池提交一个任务后,该线程池将如何调度其中的工作线程来处理这个任务。
值得注意的是:在创建线程池pool时,并非直接new了一个ExecutorService对象,而是通过了Executors类里面的静态方法完成对象的构造,这样的静态方法就是前面提到的静态工厂方法。new操作隐藏在了这个方法背后。这里就涉及到了一种常见的设计模式:工厂模式。
(2)总结:在使用连接池时所做的工作
- 调用Executors类的静态方法newCachedThreadPool或newFixedThreadPool。
- 调用submit 提交 Runnable或Callable 对象。
- 保存好返回的 Future对象,以便得到结果或者取消任务。
- 当不想再提交任何任务时,调用shutdown。
2、工厂模式
工厂模式在创建对象时不再直接new,而是使用一些其他的方法(通常是静态方法)协助我们把对象创建出来。
事实上,工厂模式更多地是用来填构造方法的“坑”的。我们知道,如果同一个类要想提供多种不同的构造对象的方式,就得基于构造方法的重载。但是构造方法是有局限性的。比如下面这种情况:将直角坐标系中的一个点封装成一个类,分别提供两个构造方法,其一是通过横坐标x和纵坐标y来表示这个点的位置,其二是用极坐标来表示这个点的位置。根据不同的构造方式写出的两个构造方法。然而,这两个方法的签名完全相同,它们并不能构成重载。
如果没有遇到这样的问题,那自然而然也就不需要工厂模式。但一旦遇到这样的问题,工厂模式就可以解决。即拿一个普通的static方法来替代。
构造一个工厂类 PointBuilder (一般工厂类的命名都是XxxxBuilder,不过上面的 Executors 是一个例外。)
上面的工厂类中,两个方法的方法名可以自定义。方法名不一样了,上述问题自然迎刃而解。
总而言之,工厂模式(Factory Pattern)是一种创建型设计模式,它提供了一种封装对象创建过程的方式。在工厂模式中,我们通过使用工厂类来创建对象,而不是直接在客户端代码中使用 new 关键字实例化对象。
工厂模式的主要目标是将对象的创建和使用分离,通过引入一个工厂类来负责创建对象。这样可以降低客户端代码和具体对象之间的耦合度,使得代码更具灵活性和可维护性。
这里Java中创建线程池也是类似,通过工厂模式来构造出了线程池。
进入 Executors.newFixedThreadPool() 的源码可以看到,确实是在工厂类中new了一个对象:
3、ThreadPoolExecutor类⭐
ThreadPoolExecutor类是 Java 中用于创建和管理线程池的一个强大工具类。它是 ExecutorService 接口的一个实现,提供了更灵活的线程池功能。
ThreadPoolExecutor类是原装的线程池类,上述所有的工厂方法都是对这个类的对象做了进一步封装。用 Executors类创建线程,使用起来更为简单但定制化能力更差;而用ThreadPoolExecutor类创建线程使用更复杂,但定制化能力更强。
打开Java官方文档,找到 java.util.concurrent,再找其下的 ThreadPoolExecutor 类。这里就能看到Java官方对这个类的详细说明。
ThreadPoolExecutor是ExecutorService接口的一个具体实现,它提供了更加灵活的线程池功能。它有多个构造方法:
这些构造方法中都有比较多的参数。我们以最后一个构造方法为例,解读一下该构造方法中的各个参数。
ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, RejectedExecutionHandler handler)
参数说明:
corePoolSize:核心线程数,即线程池中始终保持存活的线程数(即使它们处于空闲状态)。
maximumPoolSize:线程池中允许的最大线程数,包括核心线程和非核心线程。
keepAliveTime:非核心线程保持存活的时间。非核心线程的空闲时间超过该值后将被终止。
unit:用于指定空闲时间的时间单位。
workQueue:用于保存等待执行任务的阻塞队列。线程池要管理很多任务,这些任务也是通过阻塞队列来组织的。程序员可以手动指定给线程池一个队列,次吃程序员就能很方便地控制或获取队列中的信息了。(submit()方法其实就是把任务放到该队列中。)
threadFactory:工厂类,一个用来创建线程的辅助的类(可以用来自定义线程池中线程的属性、命名、优先级等)。🔗如何定义一个线程工厂?
handler:线程池的拒绝策略。即:如线程池已经满了,继续向里添加任务,如何拒绝。
在理解时,我们可以把线程池想象成一个公司,公司中有两类员工,一类是正式员工,另一类是实习生或临时工。线程池中核心线程,指的就是正式员工;非核心线程,指的则是实习生。忙的情况下,公司就多招几个实习生干活,就好比线程池中多创建几个非核心线程共同完成任务;等到闲下来了,为了节省资源,公司又将实习生辞退,相应地非核心线程也会被杀死。
corePoolSize就相当于正式员工的数量,而maximumPoolSize相当于正式员工+实习生的数量。
正式员工是签了劳动合同的,不能随意辞退,所以即使核心线程处于空闲状态也不会被销毁;而实习生并没有签劳动合同,只是签了实习合同,是可以随时辞退的。keepAliveTime就规定了实习生线程保持存活的时间。
上面的这些参数中,线程池的拒绝策略是重点。
Java多线程基础-11:工厂模式及代码案例之线程池(二)+
https://developer.aliyun.com/article/1520573?spm=a2c6h.13148508.setting.15.75194f0e0dvo2R