JVM 的内存区域如何识别垃圾

现在的位置: 首页 > 云计算 > 正文

JVM 的内存区域如何识别垃圾

2020年02月06日 ⁄ 云计算 ⁄ 共 4198字 ⁄ 字号小中大 ⁄ 评论关闭

　　Java 相比 C/C++ 最显著的特点便是引入了自动垃圾回收 (下文统一用 GC 指代自动垃圾回收)，它解决了 C/C++ 最令人头疼的内存管理问题，让程序员专注于程序本身，不用关心内存回收这些恼人的问题，这也是 Java 能大行其道的重要原因之一，GC 真正让程序员的生产力得到了释放，但是程序员很难感知到它的存在，这就好比，我们吃完饭后在桌上放下餐盘即走，服务员会替你收拾好这些餐盘，你不会关心服务员什么时候来收，怎么收。

　　有人说既然 GC 已经自动我们完成了清理,不了解 GC 貌似也没啥问题。在大多数情况下确实没问题，不过如果涉及到一些性能调优，问题排查等，深入地了解 GC 还是必不可少的，曾经美团通过调整 JVM 相关 GC 参数让服务响应时间 TP90，TP99都下降了10ms+，服务可用性得到了很大的提升!所以深入了解 GC 是成为一名优秀 Java 程序员的必修课!

　　JVM 内存区域要搞懂垃圾回收的机制，我们首先要知道垃圾回收主要回收的是哪些数据，这些数据主要在哪一块区域，所以我们一起来看下 JVM 的内存区域。

　　虚拟机栈：描述的是方法执行时的内存模型,是线程私有的，生命周期与线程相同,每个方法被执行的同时会创建栈桢(下文会看到)，主要保存执行方法时的局部变量表、操作数栈、动态连接和方法返回地址等信息,方法执行时入栈，方法执行完出栈，出栈就相当于清空了数据，入栈出栈的时机很明确，所以这块区域不需要进行 GC。

　　本地方法栈：与虚拟机栈功能非常类似，主要区别在于虚拟机栈为虚拟机执行 Java 方法时服务，而本地方法栈为虚拟机执行本地方法时服务的。这块区域也不需要进行 GC。

　　程序计数器：线程独有的，可以把它看作是当前线程执行的字节码的行号指示器，比如如下字节码内容，在每个字节码`前面都有一个数字(行号)，我们可以认为它就是程序计数器存储的内容记录这些数字(指令地址)有啥用呢，我们知道 Java 虚拟机的多线程是通过线程轮流切换并分配处理器的时间来完成的，在任何一个时刻，一个处理器只会执行一个线程，如果这个线程被分配的时间片执行完了(线程被挂起)，处理器会切换到另外一个线程执行，当下次轮到执行被挂起的线程(唤醒线程)时，怎么知道上次执行到哪了呢，通过记录在程序计数器中的行号指示器即可知道，所以程序计数器的主要作用是记录线程运行时的状态，方便线程被唤醒时能从上一次被挂起时的状态继续执行，需要注意的是，程序计数器是唯一一个在 Java 虚拟机规范中没有规定任何 OOM 情况的区域，所以这块区域也不需要进行 GC。

　　本地内存：线程共享区域，Java 8 中，本地内存，也是我们通常说的堆外内存，包含元空间和直接内存,注意到上图中 Java 8 和 Java 8 之前的 JVM 内存区域的区别了吗，在 Java 8 之前有个永久代的概念，实际上指的是 HotSpot 虚拟机上的永久代，它用永久代实现了 JVM 规范定义的方法区功能，主要存储类的信息，常量，静态变量，即时编译器编译后代码等，这部分由于是在堆中实现的，受 GC 的管理，不过由于永久代有 -XX:MaxPermSize 的上限，所以如果动态生成类(将类信息放入永久代)或大量地执行 String.intern (将字段串放入永久代中的常量区)，很容易造成 OOM，有人说可以把永久代设置得足够大，但很难确定一个合适的大小，受类数量，常量数量的多少影响很大。所以在 Java 8 中就把方法区的实现移到了本地内存中的元空间中，这样方法区就不受 JVM 的控制了,也就不会进行 GC，也因此提升了性能(发生 GC 会发生 Stop The Word,造成性能受到一定影响，后文会提到)，也就不存在由于永久代限制大小而导致的 OOM 异常了(假设总内存1G，JVM 被分配内存 100M，理论上元空间可以分配 2G-100M = 1.9G，空间大小足够)，也方便在元空间中统一管理。综上所述，在 Java 8 以后这一区域也不需要进行 GC。

　　堆：前面几块数据区域都不进行 GC，那只剩下堆了，是的，这里是 GC 发生的区域!对象实例和数组都是在堆上分配的，GC 也主要对这两类数据进行回收，这块也是我们之后重点需要分析的区域

　　如何识别垃圾JVM 的内存区域，知道了 GC 主要发生在堆，那么 GC 该怎么判断堆中的对象实例或数据是不是垃圾呢，或者说判断某些数据是否是垃圾的方法有哪些。

　　引用计数法

　　最容易想到的一种方式是引用计数法，啥叫引用计数法，简单地说，就是对象被引用一次，在它的对象头上加一次引用次数，如果没有被引用(引用次数为 0)，则此对象可回收

　　String ref = new String("Java");

　　以上代码 ref1 引用了右侧定义的对象，所以引用次数是 1。

　　如果在上述代码后面添加一个 ref = null，则由于对象没被引用，引用次数置为 0，由于不被任何变量引用，此时即被回收。

　　看起来用引用计数确实没啥问题了，不过它无法解决一个主要的问题：循环引用!啥叫循环引用。

　　public class TestRC { TestRC instance; public TestRC(String name) { } public static void main(String[] args) { // 第一步 A a = new TestRC("a"); B b = new TestRC("b"); // 第二步 a.instance = b; b.instance = a; // 第三步 a = null; b = null; }}

　　到了第三步，虽然 a，b 都被置为 null 了，但是由于之前它们指向的对象互相指向了对方(引用计数都为 1)，所以无法回收，也正是由于无法解决循环引用的问题，所以现代虚拟机都不用引用计数法来判断对象是否应该被回收。

　　可达性算法

　　现代虚拟机基本都是采用这种算法来判断对象是否存活，可达性算法的原理是以一系列叫做 GC Root 的对象为起点出发，引出它们指向的下一个节点，再以下个节点为起点，引出此节点指向的下一个结点。。。(这样通过 GC Root 串成的一条线就叫引用链)，直到所有的结点都遍历完毕,如果相关对象不在任意一个以 GC Root 为起点的引用链中，则这些对象会被判断为「垃圾」,会被 GC 回收。

　　如果用可达性算法即可解决上述循环引用的问题，因为从GC Root 出发没有到达 a,b,所以 a，b 可回收。

　　a, b 对象可回收，就一定会被回收吗?并不是，对象的 finalize 方法给了对象一次垂死挣扎的机会，当对象不可达(可回收)时，当发生GC时，会先判断对象是否执行了 finalize 方法，如果未执行，则会先执行 finalize 方法，我们可以在此方法里将当前对象与 GC Roots 关联，这样执行 finalize 方法之后，GC 会再次判断对象是否可达，如果不可达，则会被回收，如果可达，则不回收!

　　注意： finalize 方法只会被执行一次，如果第一次执行 finalize 方法此对象变成了可达确实不会回收，但如果对象再次被 GC，则会忽略 finalize 方法，对象会被回收!这一点切记!

　　那么这些 GC Roots 到底是什么东西呢，哪些对象可以作为 GC Root 呢，有以下几类：

　　虚拟机栈(栈帧中的本地变量表)中引用的对象;

　　方法区中类静态属性引用的对象;

　　方法区中常量引用的对象;

　　本地方法栈中 JNI(即一般说的 Native 方法)引用的对象。

　　虚拟机栈中引用的对象

　　如下代码所示，a 是栈帧中的本地变量，当 a = null 时，由于此时 a 充当了 GC Root 的作用，a 与原来指向的实例 new Test() 断开了连接，所以对象会被回收。

　　publicclass Test {

　　public static void main(String[] args) {

　　Test a = new Test();

　　a = null;

　　}

　　方法区中类静态属性引用的对象

　　如下代码所示，当栈帧中的本地变量 a = null 时，由于 a 原来指向的对象与 GC Root (变量 a) 断开了连接，所以 a 原来指向的对象会被回收，而由于我们给 s 赋值了变量的引用，s 在此时是类静态属性引用，充当了 GC Root 的作用，它指向的对象依然存活!

　　public class Test {

　　public static Test s;

　　public static void main(String[] args) {

　　Test a = new Test();

　　a.s = new Test();

　　a = null;

　　}

　　方法区中常量引用的对象

　　如下代码所示，常量 s 指向的对象并不会因为 a 指向的对象被回收而回收。

　　public class Test {

　　public static final Test s = new Test();

　　public static void main(String[] args) {

　　Test a = new Test();

　　a = null;

　　}

　　本地方法栈中 JNI 引用的对象

　　这是简单给不清楚本地方法为何物的童鞋简单解释一下：所谓本地方法就是一个 java 调用非 java 代码的接口，该方法并非 Java 实现的，可能由 C 或 Python等其他语言实现的， Java 通过 JNI 来调用本地方法，而本地方法是以库文件的形式存放的(在 WINDOWS 平台上是 DLL 文件形式，在 UNIX 机器上是 SO 文件形式)。通过调用本地的库文件的内部方法，使 JAVA 可以实现和本地机器的紧密联系，调用系统级的各接口方法，还是不明白?见文末参考，对本地方法定义与使用有详细介绍。

　　当调用 Java 方法时，虚拟机会创建一个栈桢并压入 Java 栈，而当它调用的是本地方法时，虚拟机会保持 Java 栈不变，不会在 Java 栈祯中压入新的祯，虚拟机只是简单地动态连接并直接调用指定的本地方法。

　　JNIEXPORT void JNICALL Java_com_pecuyu_jnirefdemo_MainActivity_newStringNative(JNIEnv *env, jobject instance，jstring jmsg) {

　　...

　　// 缓存String的class

　　jclass jc = (*env)->FindClass(env, STRING_PATH);

　　}

　　如上代码所示，当 java 调用以上本地方法时，jc 会被本地方法栈压入栈中, jc 就是我们说的本地方法栈中 JNI 的对象引用，因此只会在此本地方法执行完成后才会被释放。

【上篇】什么是B树?为啥不用二叉查找树呢
【下篇】哪些算法可以识别哪些数据是垃圾？垃圾回收主要方法有哪些

作者: admin

该日志由 admin 于4年前发表在云计算分类下，最后更新于 2020年02月06日.
转载请注明: JVM 的内存区域如何识别垃圾 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

JVM 的内存区域如何识别垃圾

作者: admin

书签

最新文章New

本站推荐

返回首页