线程池
线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务。
线程池是帮助我们处理以及管理多线程的。若是没有线程池,则每当有任务到达时都会新建一个线程来自处理,若任务特别多的时候,就会无休止的创建很多线程,这不但会消耗系统的资源,还会降低整个系统的稳定性。
然而有了线程池,则会通过对已创建线程的重复利用,降低创建和销毁线程时的资源消耗。同时,若是有任务到达,可以复用之前创建的线程不需要再去创建新的线程。同时可以规定线程池的大小,并对线程进行调优和监控,降低对整个系统的影响。
线程池的7个参数
这七个参数分别是:核心线程数,最大线程数,最大空闲时间,时间单位,阻塞队列,线程工厂,拒绝策略
我们结合当下的一个例子聊聊这七个参数
假如我们有一个公司,有几个核心员工,也有几个外包员工,有招人的hr,也有个项目经理。
员工干活,hr招人,项目经理接任务。
核心线程数 corePoolSize
就是核心员工,干活滴,不会被开除。这个公司最少会有这么多人在干活。
核心线程数就是这个线程池最低保持的线程数量
最大线程数 maximumPoolSize
这是所有员工,老板给定的最大人数,核心员工+外包的数量,最多也就这么多人。
也就是这个线程池所能容纳的最多的线程数量。当设定这个值的时候,若是小于核心线程数,会抛出非法参数的错。
最大空闲时间 keepAliveTime
这就有意思了,当外包人员没活了,在空闲这么多时间之后,就会给嘎掉,告辞了各位。
也就是说,非核心线程在这么多时间没有执行任务之后会被关闭。
时间单位 unit
这就是上边最大空闲时间的单位,外包人员看到个10,以为10天,暗自庆幸,还有时间找找新的,结果,10min,哈哈,10分钟后走人。
阻塞队列 workQueue
项目经理,活全在他这里放着,干活的从这里领活然后去处理。
线程池存放任务的队列,用来存储线程池的所有待执行任务。
线程工厂 threadFactory
这就是个hr,线程池创建之后,有任务来了,先招聘核心员工,当核心员工忙不过来的时候,再招聘外包员工。
线程池创建线程时调用的工厂方法。
拒绝策略 handler
当公司里每个人都有活干,这里包括核心员工和外包员工,并且项目经理那里也已经堆满了的时候,再有任务来的时候的处理方式
当下有四种处理方式
AbortPolicy
:拒绝并抛出异常。项目经理拒绝了新的任务,并且向上级领导上报了此事。整个公司停摆了。也就是,老子干不了了,直接掀桌子。默认就是这个拒绝策略。CallerRunsPolicy
:使用当前调用的线程来执行此任务。谁提的任务,谁处理。当一个main线程将任务抛给线程池的时候,线程池满了,并且是这个拒绝策略,则会让这个main线程去执行这个任务。也就是异步任务变成同步任务了。这个要慎用,等于阻塞了用户的请求,整体服务会变慢。DiscardOldestPolicy
:抛弃队列头部(最旧)的一个任务,并执行当前任务。项目经理放弃队列里最开始的一个任务,并将新来的任务放在最后一个。一般也不用,或者说根据实际情况看能否使用的到。DiscardPolicy
:忽略并抛弃当前任务。谁都不接受,来的新任务都忽略掉。
这个在我们环境引起过一个bug,我们使用的
DiscardPolicy
这个拒绝策略,导入8万个用户资料的时候,五个线程处理,阻塞队列的大小只有5万,这样,导入的时候只会有5万个用户被导入成功,其余的用户不见了,找了许久才发现问题在这里。也没改策略,吧导入的文件拆成了两个,分别导入了。
也可以自定义一个拒绝策略,实现RejectedExecutionHandle
接口,并重写rejectedeExecution
方法即可
线程池的状态
线程池有五个状态
RUNNING
在这个状态下,有任务就正常接收并处理,线程池刚创建出来的默认状态就是这个SHUTDOWN
这个状态下不会接受新的任务,但会处理正在执行的任务和工作队列中的任务,当线程池执行shutdown()
方法后,处于这个状态。STOP
不会接受新的任务,会立即中断正在执行的线程,并且不会处理工作队列中的任务当线程池执行当线程池执行shutdownNow()
方法之后处于这个状态TIDYING
SHUTDOWN
的工作队列中的任务都处理完了,SHUTDOWN
和STOP
工作线程都关闭之后的过渡状态,线程池马上凉凉,是个过渡状态。TERMINATED
死亡,执行terminated()
之后的状态。
那么这里为啥要一个TIDYING
这个过渡状态呢?是为了确保SHUTDOWN
和STOP
状态中的工作线程都已经关闭。在这个状态下执行了执行terminated()
方法之后这才会到TERMINATED
状态。也就是说我们可以重写这个方法,来处理一些线程池关闭之后的事情。
并且线程池的状态是在ctl
属性中记录的。本质是个int
类型,ctl的高三位记录线程池状态
在低29位,才会记录工作线程个数。也就是说即便指定的线程最大数量是Integer.MAX_VALUE
他也到不了,一个线程池的最多线程也就是2的29次方个了。
线程池执行流程
核心线程不是new完就构建的,是懒加载的机制,添加任务才会构建核心线程,具体流程看下图:
这里我们可以看到很重要的一点,当任务队列满的时候,才会创建非核心线程。
当没有任务的时候,核心线程在干什么?
线程会挂起,默认核心线程是WAITING
状态,非核心是TIMED_WAITING
如果是核心线程,默认情况下,会在阻塞队列的位置执行take()
方法,直到拿到任务为止。就是说,一直等,有活我就干,没活就一直等。
如果是非核心线程,默认情况下,会在阻塞队列的位置执行poll()
方法,等待最大空闲时间,如果没任务,直接嘎掉,如果有活,那就正常干。