JVM规范 规定,JVM 在执行 Java 程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途。以及创建和销毁的时间,有的区域随着虚拟机进程的启动就存在了,而有些区域则依赖用户线程的启动和结束而建立和销毁。JVM 规范对 JVM 定义了运行时统一的内存划分规范,统一了标准,类似于 JDBC 规范一样。JVM 也有许多厂商的不同产品。比如下面的这些:
厂商 | JVM |
---|---|
Oracle-SUN | Hotspot |
Oracle | JRocket |
IBM | J9 JVM |
阿里 | Taobao JVM |
其内存区域划分规范对于 JVM 的含义类似于我们 Java 中的接口,都是起到了规范的作用,JVM 是一台可以运行 Java 应用程序的抽象的计算机。在 JVM 中存在三个重要的概念:
对于 Java 程序员来说,在虚拟机自动内存管理机制的帮助下,不再需要为每一个对象去编写内存释放的代码,不要像 C 或者 C++ 要时刻注意着内存泄漏和内存溢出的问题,这种由虚拟机去管理一切看起来都很美好。不过,也正是因为 Java 设计者把内存控制全部交给了 JVM,一旦出现了内存泄漏和溢出方面的问题,如果不了解虚拟机是怎么分配运行时内存的,那么排查错误将是一项非常艰难的工作。
<!-- more -->
为什么我们经常把运行时数据区叫做 Java 内存模型(JMM:Java Memory Model),是因为运行时数据区太过于分散,没有联系,所以才会有 JVM 内存模型这个词,让我们把这些东西联系起来,方便记忆。JVM 运行时数据区中有些数据是一直存在的,被所有线程所共享。而有些区域则是线程私有的,伴随着线程的开始而创建,线程的结束而销毁。所以我们可以把JMM 分为两类: 线程共享的
、 线程私有的
。根据 JVM 虚拟机规范的规定,JVM 虚拟机运行时数据区划分如下图所示:
运行时数据区主要分为以下几个部分:
其中,按照线程在各个区域的数据是否共享划分为:
接下来看看 Java 运行时数据区中各个部分的用途和特点:
在 JVM 中,方法区是可供各个线程共享运行时的内存区域。方法区域传统语言中的编译代码存储区或者操作系统进程的正文段的作用非常类似,它存储了每一个类的结构信息,例如运行时常量池、字段和方法数据、类的构造函数和普通方法的字节码内容、还包括一些类、实例、接口初始化的时候用到的特殊方法。在 Hotspot 虚拟机中,JDK 1.7 版本称作 永久代(Permanent Generation)
,而在 JDK 1.8 则称为 元空间(Metapace)
。
方法区有个别名叫做非堆(Non-Heap),用于区别于 Java 堆区。默认最小值为 16 MB,最大值为 64 MB,可通过 -XX:PermSize
和 -XX:MaxPermSize
参数设置方法的大小。
JDK 1.7 及之前的版本设置为:
-XX:PermSize=10m -XX:MaxPermSize=55m
JDK 1.8 及之后的版本设置为:
-XX:MetaspaceSize=10m -XX:MaxMetaspaceSize=55m
对常量池的回收和对类型的卸载
方法区是所有都线程共享的,在一定的条件下它也会被 GC,当方法区域需要使用的内存超过其允许的大小时,会抛出 OOM(OutOfMemory)错误信息。
类加载后,Class 文件结构中常量池中的数据将被存储在运行时常量池中。我们一般在一个类中通过 public static final
来声明一个常量或者声明一个字符串 String str = "abc"
。这个类编译后产生的 Class 文件,这个类的所有信息都存储在这个 class 文件中,当这个类被 JVM 加载之后,class 文件中的常量就存放在方法区的运行时常量池中。而且在运行期间,可以向常量池添加新的常量。比如,String 类的 intern() 方法就能在运行期间向常量池中添加新的常量。当运行时常量池中的某些常量没有被对象引用,同时也没有被变量引用时,那么就需要垃圾收集器回收。JVM 为每个已加载的类型维护一个常量池,常量池就是这个类型用到的常量的一个有序集合。其包括直接常量(基本类型,String)和对其他类型、方法、字段的符号引用。即字面量和符号引用,其中字面量指的是整个类中的字面量。包含成员变量、静态方法、非静态方法等中的字面量。池中的数据和数组一样通过索引访问。
Java 虚拟机栈是描述 Java 方法运行过程的内存模型。Java 虚拟机栈会为每一个即将运行的方法创建一块叫做 栈帧
的区域,这块区域用于存储用于方法在运行时所需要的一些信息,这些信息具体包括:
当一个方法即将被运行时,Java 虚拟机栈首先会在 Java 虚拟机栈中为该方法创建一块"栈帧",栈帧中包含局部变量表,操作数栈,动态链接,方法出口信息等。当方法在运行过程中需要创建局部变量时,就将局部变量的值存入栈帧的局部变量表中。当这个方法执行完毕后,这个方法所对应的栈帧将会出栈,并释放内存空间。 Java 虚拟机栈上数据都是私有的
,其他线程都不能访问该线程的栈数据。在函数中定义的一些基本类型的变量数据和对象的引用变量都在函数的栈内存中分配。当在一段代码块中定义一个变量时,Java 就会在栈中为这个变量分配内存空间,当该变量退出该作用域后,Java 会自动释放掉为该变量所分配的内存空间,该内存空间可以立即被另作他用。
StackOverFlowError
:若 Java 虚拟机栈的内存大小不允许动态扩展,那么当线程请求栈的深度超过当前 Java 虚拟机栈的最大深度的时候就会抛出 StackOverFlowError。 OutOfMemoryError
:若 Java 虚拟机栈的内存大小不允许动态扩展,那么当线程请求栈时内存用完了,无法再动态扩展了,此时就会抛出 StackOverFlowError。 本地方法指的是使用 Java 以外的其他语言编写的代码,因为有些时候 Java 无法直接操作一些底层资源,只能通过 C 或汇编操作。因此需要通过本地方法来实现。而本地方法栈就是设计用来调用这些非 Java 语言方法的。会存放对应的局部变量信息、返回结果等。本地方法栈和 Java 虚拟机栈实现的功能类似,只不过本地方法栈是本地方法运行的内存模型。区别是虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈则是为虚拟机用到的 Native 方法服务,本地方法被执行的时候,在本地方法栈也会创建一个栈帧,用于存放该本地方法的局部变量表、操作数栈、动态链接以及出口信息等。方法执行完毕后相应的栈帧也会出栈并释放内存空间。也会抛出两种错误,StackOverFlowError 和 OutOfMemoryError。
堆是用来存放对象(类、接口、数组)的内存空间。几乎所有的对象都存储在堆中(实例创建后,成员变量也随对象存在堆中,随着垃圾回收进行释放)。堆是一个运行时数据区,在程序运行时动态分配内存。
在堆中产生了一个数组对对象后,还可以在栈中定义一个特殊的变量,让栈用这个变量的取值等于数组或对象在堆地址内存中的首地址,栈中的这个变量就成了数组或对象的引用变量。引用变量就相当于是为数组和对象起的一个名称,以后就可以在程序中使用栈中的引用变量来访问堆中数组或对象。
引用变量是普通的变量,定义时在栈中分配,引用变量在程序运行到其作用域外后释放。而数组和对象本身在堆中分配,即使程序运行到使用 new 产生数组或者对象的语句所在的代码之外,数组和对象本身占据的内存空间不会被释放,数组和对象在没有引用指向它的时候才会变为垃圾,不能再被使用。仍然占据内存空间不放,在随后的一个不确定的时期被 GC 垃圾回收收走。这也是 Java 比较占用内存的原因之一,实际上,栈中的变量指向堆内存的变量,这就是 Java 中的指针。
新生代:新生代程序新创建的对象都在新生代分配的,新生代由 Eden Space
和两块大小相同的 Survivor Space
(通常又称 S0 和 S1或 FROM 和 To )构成,可通过 -Xmn 参数来指定新生代的大小,也可以通过 -XX:SurvivorRation 来调整 Eden Space 及 Survivor Space 的大小,因此新生代又可被分为:Eden,From Survivor,To Survivor。
老年代:老年代用户存放经过多次新生代垃圾回收仍然存活的对象,例如缓存对象,新建的对象也有可能直接进入老年代。主要有两种情况:一种是 大对象
,可通过启动参数设置 -XX:PretenureSizeThreshold=1024(单位为字节,默认为 0)来代表超过多大时就不再在新生代分配,而是直接在老年代分配。另一种是 大的数组对象
,且数组中无引用外部对象。老年代所占的内存大小为 -Xmx 对应的值减去 -Xmn(新生代)对应的值。不同的区域存放具有不同生命周期的对象。这样可以根据不同的区域使用不同的垃圾回收算法,从而更具有针对性,从而更加高效。
老年代:三分之二的堆空间
年轻代:三分之一的堆空间
程序计数器是一块比较小的内存空间,可以把它看作当前线程正在执行的字节码的行号指示器。程序计数器里面记录的是当前线程正在执行的那一条字节码指令的地址。当然, 程序计数器是线程私有的
。但是,如果当前线程执行的是一个线程本地的方法,那么此时这个线程的程序计数器为空。
本地方法为 Native Method,即由 native 修饰的方法。在定义一个 native 方法时,并不提供实现(类似 Java 中的接口或者抽象方法),因为其实现往往是由外面的 C 或者 C++ 等非 Java 语言实现的。
程序计数器主要有两个作用:
涉及到内存模型,往往都会提到永久代,那么它和方法区又是什么关系呢?
JVM 虚拟机规范 只是规定了有方法区这个概念和它的作用,并没有规定如何实现它。那么,在不同 JVM 上方法区的实现肯定是不同的。同时大多数公司用的 JVM 都是 Oracle 公司的 HotSpot。在 HotSpot 上把 GC 分代收集扩展至方法区,或者说使用永久代来实现方法区。因此,我们可以得到结论,永久代是 HotSpot 的概念,方式区是 JVM 规范的定义,是一种规范,而永久代是一种实现,一个是标准一个是实现。其它的虚拟机实现并没有永久代这么一说。在 JDK 1.7 及之前的实现中,HotSpot 使用永久代实现方法区,HotSpot 使用 GC 分代来实现方法区内存回收,可以使用以下参数来调准方法区的大小:
-XX:PermSize # 方法区初始大小 -XX:MaxPermSize # 方法区最大大小(超过这个值会抛出 OutOfMemoryError 异常:java.lang.OutOfMemoryError:PermGen)
对于 Java 8,HotSpot 取消了永久代,那么是不是也就没有方法了吗?
当然不是,方法区是一个规范,规范没变,它就会一直在。那么取代永久代的就是元空间。它和永久代有什么不同呢?
两个“栈”功能类似,都是方法运行过程的内存模型。并且两个“栈”内部构造相同,都是方法私有的。只不过 Java 虚拟机栈描述的是 Java 方法运行过程的内存模型,而本地方法栈是描述 Java 本地方法运行过程的内存模型。
方法区本质上还是属于堆的一个逻辑部分。堆中存放对象,方法区中存放类信息、常量、静态变量,即时编译器编译后的代码等。
在创建对象的时候,非静态成员会被加载到堆内存中,并完成成员变量的初始化。也就是说所有的非静态成员(成员变量、成员方法、构造方法、构造代码块和普通代码块)都是保存在堆内存中的。但是方法调用的时候,调用的方法会在栈内存中执行,构造代码块也会在栈内存中执行。
Java 虚拟机栈、程序计数器和本地方法栈都是线程私有的,也就是说每个线程都是各自的程序计数器、Java 虚拟机栈和本地方法栈。他们的生命周期和线程的生命周期一样。而堆、方法区则是线程共享的,在 JVM 中只有一个堆,一个方法区。并在 JVM 启动的时候就创建,直到 JVM 停止的时候才销毁。
参考文章:
Java Memory Management for Java Virtual Machine (JVM)
The Java® Virtual Machine Specification(Java SE 8 Edition)