本文主要是介绍JVM 垃圾收集器初探,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
垃圾收集算法
标记-清除算法
标记-清除(Mark-Sweep)算法,如同名字一样,分为两个阶段:即标记
和清除
阶段。
首先标记处需要回收的对象(使用可达性分析),标记完成后统一回收。
缺点:
- 效率低,尤其是清除阶段,需要针对每个标记逐一清除
- 产生内存碎片,导致分配较大对象时找不到合适的空间
以上问题也是操作系统在文件管理时会遇到的问题,而找不到空间存放较大对象则会导致再一次垃圾收集的启动,影响效率。
复制算法
算法思想是,将内存空间平均分为同等大小的两块,其中一块用于存放内存,另一块空着。分配对象空间时,按序分配,当其中一块用完时,触动垃圾回收,标记出需要回收的对象和不需要回收的对象,然后将满的那一块上仍存活对象按序移到另一块空的上,满的那一块则腾出来了。该算法也需要标记。
这样每次分配时就不同考虑内存碎片的情况,每次分配时只要移动堆顶指针,按序分配内存即可。但问题是可用内存缩小了一半。
为了克服浪费内存的问题,整理算法做如下修改:将内存分为三块,一块较大的eden空间和两块survivor空间。
每次分配时使用eden和一块survivor,当回收时,将eden和survivor上的存活对象移到另一块survivor上,然后清理掉eden和一块survivor上的空间。
研究表明大部分对象都是朝生夕死
的,因此这种做法是可以的,不太会引起survivor放不下的情况。
一般来说,如果遇到survivor上放不下的情况,则这些对象将被迁移到老年代。(关乎新生代和老年代请看下面)
标记-整理算法
标记-整理(Mark-Compact)算法,第一阶段仍是标记,不同之处在于第二阶段,不是直接对对象进行回收,而是让所有存活的对象都向一端移动。整体效果就是标记-清除后在进行压缩。
分代收集算法
分代收集(Generational Collection)更像是一种纯粹的思想。其主旨是将对象进行分代管理,分为新生代和老年代,分代的依据是对象存活的周期次数。
比如对象经过多次垃圾回收后仍存活,则将其移到老年代。同时,新生代和老年代采用不同的垃圾收集算法。
- 一开始所有对象,所有对象都在新生代区域,老年代区域为空;
- 新生代进行一次垃圾回收,由于新生代大部分对象都是朝生夕死,因此新生代采取的垃圾回收算法是复制算法。
- 新生代经过多次垃圾回收后,发现survivor区域放不下了,于是将survivor中的对象移到老年代,
- 老年代进行垃圾回收,由于老年代的对象存活率高,常采用标记-整理/标记清除算法。
算法的具体细节
上述只是介绍了整体的算法思想, 但在实际应用中还需要考虑实现的细节。
可达性分析的具体实现
通过可达性分析得出哪些对象需要被回收,然后在执行垃圾回收算法。
但具体可达性分析是如何实现的呢?
使用图的遍历,不管是深度优先还是广度优先。
但一开始的节点如何选择呢?即如何选择GC Roots?
一般是全局性的引用(例如常量或者类静态属性),栈帧中的局部变量表。
问题:
- 方法区就有数百兆,如何逐一检查每个引用,必然会消耗很多时间。
- 在进行可达性分析时,我们需要注意到其他的Java线程仍是在执行的,这会导致可达性分析的误差,于是不得不暂停所有的Java线程(一般称为Stop The World).
解决思路:
一种较好的方法是使用一个表来记录这些GC Roots。
JVM使用一组称为OopMap的数据结构来直接得知哪些方法存放着对象的引用。于是在OopMap的帮助下,JVM就可以快速准确的完成GC Roots的枚举了。
GC 执行
程序执行时并非在所有地方都可以 STW 来开始 GC,只有到达特定的地点才可以,这些地点被称为安全点(Safepoint)。
这样做的目的是为了减少OopMap的存放次数。
也就是说当执行GC时,并不是马上就行垃圾回收,因为有些线程并不在安全点上,于是就有了主动式中断的思想,即GC开始时,需要中断线程,此时不是直接对线程操作,而是设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志,就自己主动挂起。
这篇关于JVM 垃圾收集器初探的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!