整理归纳HotSpot中的GC收集器相关性能,算法使用,GC过程和相互搭配。需要先明确一个观点:GC收集器根本上来说没有绝对的优劣,我们只能根据具体场景选择最适合的GC组合,而不是选择一个完美的GC组合。
介绍之前,先需要了解两个名词概念:
单线程有两个方面含义: 一方面 ,serial收集器只使用一个CPU或一条收集线程进行GC; 另一方面 ,serial进行GC时,需要暂停其他所有的工作线程直到垃圾回收结束(Stop The World)
一方面,Serial收集器只是用一条GC线程去执行收集任务;另一方面,Serial收集器进行收集时,必须暂停其他所有的工作线程(Stop The World),直到收集结束。
CMS等收集器关注点是 尽可能缩短垃圾收集时用户线程停顿的时间 ,Parallel Scavenge收集器关注的是 达到一个可观的吞吐量 。
停顿时间短适合需要和用户交互多的程序;高吞吐量可以高效利用CPU使用率,适合在后台运算而不需要太多交互的任务。
Parallel Scavenge收集器提供两个参数用于控制吞吐量:
-XX:MaxGCPauseMillis :最大垃圾收集停顿时间。值与新生代空间和吞吐量成反比。
-XX:GCTimeRatio:吞吐量大小。值可以理解为 正常运行时间相对垃圾收集时间的倍数,即正常运行时间/垃圾回收时间 ,默认值为99,即允许最大1%(1/1+99)的垃圾收集时间。
GC自适应调节策略:
Parallel Scavenge收集器还有一个参数-XX:+UseAdaptiveSizePolicy设置当前系统是否使用自适性系统参数调节,当开关打开时,系统不需要手动设置新生代大小、Eden和Survivor比例、晋升老年代对象年龄。
![Parallel Scavenge/Parallel Old
收集器运行过程.png]( https://upload-images.jianshu...
HotSpot第一款真正意义上的并发收集器。第一次实现了GC线程和工作线程(基本上)同时工作
只标记GC Roots能直接关联到的对象,需要Stop The World(STW)。
进行GC Roots引用链追踪,标记所有有关联的对象。这时GC线程能和用户线程同时工作(用书上的形容是:真正的实现了你边丢垃圾,你妈妈边打扫卫生)。
修正并发标记时,发生引用关系变化的那部分对象的引用,需要Stop The World。
使用并发-清除算法对垃圾对象进行清除。
CMS清除内部状态,为下次GC做准备
整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,从总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的
虽然并发标记和并发清除时,不会导致用户线程停顿,但由于占用一部分线程资源而导致应用程序速度变慢。CMS默认启动的回收线程是(CPU数量 + 3) / 4
CMS收集器进行到并发清除阶段时,由于并发执行,系统仍然会产生一些垃圾,这些垃圾产生在标记之后,所以需要等待下次GC再清除他们,这些垃圾叫做“浮动垃圾”。正因如此,CMS收集器对老年代需要预留一部分空间提供并发收集时的程序运作使用。
CMS通过设置参数(-XX:CMSInitiatingOccupancyFraction)用来表示老年代使用多少空间时,激活CMS。设置这个参数需要有两方面的考量:一方面,当参数值设置过低,触发CMS的GC次数会变多,降低性能;另一方面,当参数值设置过高,剩余空间不足以存储产生的浮动垃圾,系统会报“Concurrent Mode Failure”,系统将启动预备方案:使用Serial Old收集器进行老年代的垃圾收集,这样导致耗时更多,影响性能。
并发-清除算法将产生大量空间碎片,当大对象进入内存时,会由于没有足够的连续内存空间分配而提前触发Full GC。
为此设计者提供了两个参数。 -XX:+UseCMSCompactAtFullCollection 开关参数控制CMS收集器在需要进行Full GC时,是否开启内存碎片整理过程(默认是开启的)。 -XX:CMSFullGCsBeforeCompaction 设置执行多少次不压缩内存空间的Full GC后,进行一次带压缩的Full GC( 默认为0,即每次进入Full GC都要进行碎片整理 )。
代替Parallel Scavenge和Parallel Old组合收集器,成为JDK1.9服务端模式下默认垃圾收集器。设计初衷是建立起“停顿时间模型”的收集器,即 支持指定在一个长度为M毫秒的时间片段内,消耗在GC上的时间不超过N毫秒 这样的目标。
可预测的停顿:G1支持使用者设置在M时间中停顿N秒。G1在后台维护一个列表用于记录每个Region里面的垃圾回收的价值(回收获得的空间大小和回收所需时间),根据用户设置的时间,制定回收计划,优先回收价值大的区域(Garbage-First的由来)。
之前的垃圾收集器的垃圾收集对象为整个新生代(Minor GC)、整个老年代(Major GC)或整个Java堆(Full GC)。而G1面向 堆内存的任何部分来组成回收集 进行垃圾回收,衡量标准不再是内存属于哪个年代,而是 哪块内存中存放的垃圾数量最多,回收收益最大 。
为了实现这一收集目标,G1的堆内存布局开创了 基于Region 的堆内存布局。
G1虽仍然遵循分代收集,但是不同于之前的收集器将年轻代、年老代和元空间按照固定大小以及固定数量进行区域划分,而是 将连续的Java堆划分为大小相等的若干区域——Region,每个区域根据需要可以是任何年代的对象,各个年代没有物理连续只有逻辑上的连续。 收集器就可以根据扮演不同年代的Region采用不同的回收策略。
除此之外,增加了一个区域—— Humongous区域 ,用于存储巨型对象,如果一个对象占用空间超过Region容量的一般,G1则认为这是一个巨型对象(Region取值范围为1MB~32MB,应为2的N次幂,通过-XX:G1HeapRegionSize设定)。 如果一个Region装不下一个巨型对象,则会寻找连续的Humongous分区来存储,有时为找到连续的H分区,有时会触发Full GC 。H区域的出现避免了短期存在的巨型对象对GC造成负面影响。G1大多数行为把H区域当做老年代看待。
有了新的垃圾收集思想和堆内存布局,“可预测的停顿时间模型”得以实现:
只标记GC Roots能直接关联到的对象,修改TAMS指针值,让下个阶段能正确的在可用Region中分配对象。需要停顿线程,但借用Minor GC的时候同步完成,没有额外停顿。
从GC Roots进行可达性遍历,对整个Java堆的对象图进行扫描,找出回收对象。这个阶段可以和用户线程并发执行。还要重新处理SATB记录下的在并发时引用有变动的对象。
处理并发阶段后遗留下来的少量的SATB 记录,需要短暂暂停。
SATB(Snapshot At The Beginning):简单地说就是初始标记阶段和并发标记阶段标记为活的的对象就是活的。然后并发标记阶段新增或者引用重新执行的对象也认为是活的。其他的就是死的
更新Region统计数据,对各Region回收价值和成本进行排序,根据用户期望停顿时间来指定回收计划。回收过程将决定回收的那一部分Region的存活对象复制到空的Region中,然后清理掉旧的Region的全部空间。需要停顿用户线程。
由回收过程可以看出G1并非纯粹追求低延迟,而是在延迟可控的情况下获得尽可能高的吞吐量。
jdk1.7 Parallel Scavenge(新生代)+Parallel Old(老年代)
jdk1.8 Parallel Scavenge(新生代)+Parallel Old(老年代)
jdk1.9 G1