转载

一文了解Java虚拟机的重要组成

JVM是JAVA平台的重要组成之一，因涉及知识点太多，故从以下几个方面对JVM进行浅层面的介绍，如果需要深入理解，推荐学习机械工业出版社的《深入理解JAVA虚拟机》。

一文了解Java虚拟机的重要组成

一、JAVA内存结构

Java虚拟机规范中规定的JVM运行时数据区如下图所示：

一文了解Java虚拟机的重要组成

总体来说，分为线程共享部分（方法区、堆）和线程隔离区（虚拟机栈、本地方法栈和程序计数器）。

1.方法区

用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。其中常量存储于运行时常量区中，运行时常量区是区的一部分，用于存储编译期生成的字面量和符号引用。但运行时常量区的内容并不只是在编译期间产生，通过String.intern()也可以实现在运行时向常量区中添加内容。

2.堆

是JVM中最大的一块内存区域，该区域的目的只是用于存储对象实例及数组。该区域也是GC的最主要区域。

3.虚拟机栈

每个线程方法在执行时都会创建一个栈帧，包含局部变量表、返回地址、操作数栈等信息。每个方法的执行与完成就对应的栈帧的入栈与出栈过程。局部变量表占用空间的大小在编译期就确定了。

4.本地方法栈

与虚拟机栈类似，不过其中执行是本地方法。对于HotSpot虚拟机而言，本地方法栈和虚拟机栈是统一的。

5.程序计数器

是一个小的内存空间，如果线程正在执行的是一个java方法，则此内存区域记录正在执行的虚拟机字节码指令；如果线程正在执行的是native方法，则计算器中的值为空。

二、JAVA垃圾回收机制

JAVA的垃圾回收主要涉及到确定对象是否存活、垃圾收集等算法，其中确定对象回收算法采用的是可达性分析算法，垃圾收集目前各JVM厂商广泛采用的是分代收集算法。这里面主要描述下分代收集算法的过程。

一文了解Java虚拟机的重要组成

分代收集算法的核心思想是将内存区域按照对象的生存周期阶段进行划分，其中将堆区划分为新生代（young generation）和老年代(old generation)。将非堆区（一般指方法区）划分为持久代（permanent generation）。

1.新生代

新生代又可再分为Eden区和两个Survivor区（两个Survivor区的大小是一样的，便于交换）。新生成的对象都会先在新生代的Eden区进行保存。新生代的特点是每次垃圾回收都会有大量的内存被回收，而且收集比较频繁，所以新生代适合如下的收集算法：

首先，新生成的对象分配到Eden区，如果eden区满了，则将可达性的对象复制到survivor1区，后清空eden区。

然后，如果survivor1区满了，则将eden区与survivor1区的可达性对象复制到survivor2区，后清空eden区和survivor1区，清空完后将survivor2区与survivor1区交换，即保持survivor2是空的。

再次，如果survivor2区也满了，则将eden区、survivor1区、survivor2区的可达性对象复制到老年代中，并清空新生代中。

最后，如果老年代也满了，就触发full gc了。

2.老年代

老年代的内存比新生代大的多，这个区域执行垃圾回收的频度不高。当老年代满时，会触发full gc。

3.持久代

持久代一般指方法区，该区需要回收的有废弃的常量和类。对于常量可用可达性分析的方法进行判断回收，对于类则需要同时满足以下条件才会被回收：

首先，该类的所有实例对象都已被回收；

其次，该类的类加载器也已被回收；

再次，该类的Class方法没有在任何地方被引用，即无法通过在任何地方通过反射访问到该类的方法。

4.什么时候会解决垃圾回收？

综上所述，当eden满时，就会触发scavenge gc，当出现以下情况时会触发full gc：

老年代已满；

持久代已满；

调用System.gc()方法；

三、JAVA类加载过程

JVM类加载过程具体装载、验证、准备、解析、初始化这五个部分。

1.装载

在装载过程中，需要完成以下事情：

1）通过类的全限定名获取类的二进制字节流；

2）将类的二进制字节流转换为方法区的运行时数据结构；

3）生成一个代表此类的java.lang.Class对象，作为方法区这个类的各种数据的访问入口。

2.验证

验证、解析和初始化又称为是连接阶段，在验证验证主要是确保二进制字节流符合JVM的规范，不会危害计算机的安全。具体验证阶段需要做的事情如下：

1）文件格式验证，验证字节流是否符合Class文件格式规范；

2）元数据验证，对字节码进行语义验证，以保证其描述信息符合JAVA语言规范；

3）字节码验证，通过数据流和控制流分析，确定程序语义是合法的、符合逻辑的；

4）符号引用验证，对常量池中的各种符号引用的信息进行匹配性验证。

3.准备

准备的过程其实是分配内存的过程。在这个阶段有两个容易产生混淆的概念：一是此阶段分配内存的只是类变量（static变量），不包含实例变量，实例变量的内存分配是在对象实例化时随对象一起分配在堆中；二是该阶段分配内存中保存的值只是数据类型的零值，具体值需要在初始化阶段进行赋值。也有特殊情况，就是对于静态常量（final修饰）会在准备阶段将值赋值为真实值。