转载

JVM的内存结构详解

JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。

2、JRE/JDK/JVM是什么关系

JRE(JavaRuntimeEnvironment,Java运行环境),也就是Java平台。所有的Java程序都要在JRE下才能运行。普通用户只需要运行已开发好的Java程序,安装JRE即可。

JDK(Java Development Kit)是程序开发者用来来编译、调试Java程序用的开发工具包。JDK的工具也是Java程序,也需要JRE才能运行。为了保持JDK的独立性和完整性,在JDK的安装过程中,JRE也是 安装的一部分。所以,在JDK的安装目录下有一个名为jre的目录,用于存放JRE文件。

JVM(JavaVirtualMachine,Java虚拟机)是JRE的一部分。它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。JVM有自己完善的硬件架构,如处理器、堆栈、寄存器等,还具有相应的指令系统。Java语言最重要的特点就是跨平台运行。使用JVM就是为了支持与操作系统无关,实现跨平台。

3、JVM执行程序的过程

  • 加载.class文件
  • 管理并分配内存
  • 执行垃圾回收

JRE(java运行时环境)是JVM构造的java程序的运行环境,也是Java程序运行的环境,但是一个操作系统的一个应用程序一个进程也有他自己的运行的生命周期,也有自己的代码和数据空间。JVM在整个jdk中处于最底层,负责于操作系统的交互,用来屏蔽操作系统环境,提供一个完整的Java运行环境,因此也就虚拟计算机。操作系统装入JVM是通过jdk中Java.exe来完成,通过下面4步来完成JVM环境:

  • 创建JVM装载环境和配置
  • 装载JVM.dll
  • 初始化JVM.dll并挂界到JNIENV(JNI调用接口)实例
  • 调用JNIEnv实例装载并处理class类

4、JVM的生命周期

(1)JVM实例对应了一个独立运行的java程序它是进程级别

  • 启动。启动一个Java程序时,一个JVM实例就产生了,任何一个拥有 public static void main(String[]args)函数的class都可以作为JVM实例运行的起点。
  • 运行。main()作为该程序初始线程的起点,任何其他线程均由该线程启动。JVM内部有两种线程:守护线程和非守护线程,main()属于非守护线程,守护线程通常由JVM自己使用,java程序也可以表明自己创建的线程是守护线程。
  • 消亡。当程序中的所有非守护线程都终止时,JVM才退出;若安全管理器允许,程序也可以使用Runtime类或者System.exit()来退出。

(2)JVM执行引擎实例则对应了属于用户运行程序的线程它是线程级别的

5、JVM垃圾回收

GC (Garbage Collection)的基本原理:将内存中不再被使用的对象进行回收,GC中用于回收的方法称为收集器,由于GC需要消耗一些资源和时间,Java在对对象的生命周期特征进行分析后,按照新生代、老年代的方式来对对象进行收集,以尽可能的缩短GC对应用造成的暂停。

  • 对新生代的对象的收集称为minor GC
  • 对旧生代的对象的收集称为Full GC
  • 程序中主动调用System.gc()强制执行的GC为Full GC

不同的对象引用类型,GC会采用不同的方法进行回收,JVM对象的引用分为了四种类型:

  • 强引用:默认情况下,对象采用的均为强引用(这个对象的实例没有其他对象引用,GC时才会被回收)
  • 软引用:软引用是Java中提供的一种比较适合于缓存场景的应用(只有在内存不够用的情况下才会被GC)
  • 弱引用:在GC时一定会被GC回收
  • 虚引用:由于虚引用只是用来得知对象是否被GC

Java程序具体执行的过程:

JVM的内存结构详解
  • 首先Java源代码文件(.java文件)会被Java编译器(javac.exe)编译为字节码文件(.class文件)。
  • 然后由JVM中的类加载器(ClassLoader)加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。在整个程序执行过程中,JVM会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是 我们常说的JVM内存。因此,在Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。

二、运行时数据区的组成/JVM内存结构/Java内存空间分类

JVM在Java程序运行时把它所管理的内存划分为几个不同的数据区域:程序计数器(Program Counter Register)、虚拟机栈(VM Stack)、本地方法栈(Native Method Stack)、 方法区(Method Area)、堆(Heap)。

JVM的内存结构详解
JVM的内存结构详解

如上图所示,方法区和堆为线程共享区,虚拟机栈、本地方法栈和程序计数器为线程独占区。在JVM规范中虽然规定了程序在执行期间运行时数据区应该包括这几部分,但是至于具体如何实现并没有做出规定,不同的虚拟机厂商可以有不同的实现方式。

方法区是虚拟机规范中对运行时数据区划分的一个内存区域,不同的虚拟机厂商可以有不同的实现,而HotSpot虚拟机以永久代来实现方法区,所以方法区是一个规范,而永久代则是其中的一种实现方式。

(一)程序计数器/寄存器

程序计数器(Program Counter Register),也有称作为PC寄存器。程序计数器是一块较小 的空间,它可以看作是当前线程所执行的字节码的行号指示器。

如果线程执行的是java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址,如果正在执行的是native方法,这个计数器的值为undefined。

JVM的多线程是通过线程轮流切换并分配CPU执行时间片的方式来实现的,任何一个时刻,一个CPU都只会执行一条线程中的指令。为了保证线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各线程间的程序计数器独立存储,互不影响。

此区域是唯一一个在java虚拟机规范中没有规定任何OutOfMemoryError情况的区域,因为程序计数器是由虚拟机内部维护的,不需要开发者进行操作。

(二)Java虚拟机栈

描述的是java 方法执行的内存模型:每个方法被执行的时候 都会创建一个“栈帧”用于存储局部变量表(包括参数)、操作栈、方法出口等信息。每个方法被调用到执行完的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。声明周期与线程相同,是线程私有的。

局部变量表存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(引用指针,并非对象本身),其中64位长度的long和double类型的数据会占用2个局部变量的空间,其余数据类型只占1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大的局部变量是完全确定的,在运行期间栈帧不会改变局部变量表的大小空间。

(三)本地方法栈

与虚拟机栈基本类似,区别在于虚拟机栈为虚拟机执行的java方法服务,而本地方法栈则是为Native方法服务。HotSpot虚拟机不区分虚拟机栈和本地方法栈,两者是一块的。与虚拟机栈一样,本地方法栈也会抛StackOverflowError和OutOfMemoryError异常。

(四)堆

JVM管理的最大的一块内存区域,存放着对象的实例,是线程共享区。

堆是垃圾收集器管理的主要区域,因此也被称为“GC堆”。

JAVA堆的分类:

  • 从内存回收的角度上看,可分为新生代(Eden空间,From Survivor空间、To Survivor空间)及老年代(Tenured Gen)

  • 从内存分配的角度上看,为了解决分配内存时的线程安全性问题,线程共享的JAVA堆中可能划分出多个线程私有的分配缓冲区(TLAB)

JAVA堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。

可通过参数 -Xmx -Xms 来指定运行时堆内存的大小,堆内存空间不足也会抛OutOfMemoryError异常。

(五)方法区

也称”永久代” 、“非堆”,它用于存储虚拟机加载的类信息、常量、静态变量、是各个线程共享的内存区域。默认最小值为16MB,最大值为64MB,可以通过-XX:PermSize 和 -XX:MaxPermSize 参数限制方法区的大小。

运行时常量池:是方法区的一部分,其中的主要内容来自于JVM对Class的加载。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池,用于存放编译器生成的各种符号引用,这部分内容将在类加载后放到方法区的运行时常量池中。

直接内存(Direct Memory)

直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,它直接从操作系统中分配,因此不受Java堆大小的限制,但是会受到本机总内存的大小及处理器寻址空间的限制,因此它也可能导致OutOfMemoryError异常出现。在JDK1.4中新引入了NIO机制,它是一种基于通道与缓冲区的新I/O方式,可以直接从操作系统中分配直接内存,即在堆外分配内存,这样能在一些场景中提高性能,因为避免了在Java堆和Native堆中来回复制数据。

三、总结

程序计数器/寄存器: 我们在程序中无法控制

堆:存放用new产生的数据(对象实例和数组)

栈:基本数据类型和对象的引用, 对象本身是不存放在栈中的,而是存放在堆中

方法区: 存放在对象中用static定义的静态成员(全局变量和静态变量)和常量

JVM的内存结构详解
原文  https://juejin.im/post/5ec3ea02e51d457882667496
正文到此结束
Loading...