Java 虚拟机在执行 Java 程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程启动而存在,有些区域则是依赖用户线程的启动和结束而建立和销毁。Java 虚拟机所管理的内存包括以下几个运行时数据区域:
程序计数器(Program Counter Register)是一块非常小的内存空间,它的作用可以看作是当前线程所执行的字节码的行号指示器。每个线程都有一个独立的程序计数器,因此程序计数器是线程私有的一块空间。此外, 程序计数器是 Java 虚拟机规定的唯一不会发生内存溢出的区域 。
在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等都需要依赖这个计数器来完成。
方法区(Method Area)是一个线程共享的区域,主要用于存储 虚拟机加载的类信息 、 常量 (final)、 静态变量 (static), JIT (即时编译器)编译后的代码等数据。
在 JDK1.7 及其之前,方法区是堆的一个“逻辑部分”(一片连续的堆空间),但为了与堆做区分,方法区还有一个名字叫“非堆”,也有人用“永久代”(HotSpot 对方法区的实现方法)来表示方法区。
当方法区无法满足内存分配需求时,将抛出 OutOfMemoryError
异常。
从 JDK1.8 开始,已经不存在永久代,替代它的一块空间叫做 元空间 。
去永久代的原因:
字符串存在永久代中,容易出现性能问题和内存溢出;
类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出;
永久代会为 GC 带来不必要的复杂度,并且回收效率偏低。
Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存储编译期生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
当常量池无法再申请到内存时会抛出 OutOfMemoryError
异常。
虚拟机栈(Java Virtual Machine Stacks)也是每个线程私有的一块内存空间,它的生命周期与线程相同。虚拟机栈描述的是 Java 方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象应用(reference 类型,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个执行对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和 returnAddress 类型(指向了一条字节码指令的地址)。
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出 StackOverflowError
异常;如果虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出 OutOfMemoryError
异常。
本地方法栈与虚拟机栈的区别是,虚拟机栈执行的是 Java 方法,本地方法栈执行的是本地方法(Native Method),其他基本上一致,在 HotSpot 中直接把本地方法栈和虚拟机栈合二为一。本地方法栈区域会抛出 StackOverflowError
和 OutOfMemoryError
异常。
堆内存主要用于存放对象和数组,它是 JVM 的内存中最大的一块区域, 堆内存和方法区都被所有线程共享 ,在虚拟机启动的时候创建。在垃圾收集的层面来看,由于现在收集器基本都采用 分代收集算法 ,堆内存空间还分为 新生代 (Young Generation)和 老年代 (Old Generation),新生代分为 Eden 区、From Survivor 区、To Survivor 区。
是用来存放新生的对象。一般占据堆的 1/3 空间。由于频繁创建对象,所以新生代会频繁触发 MinorGC 进行垃圾回收。新生代又分为 Eden 、From Survivor 、To Survivor 三个区。
Eden 区:Java 新对象的出生地(如果新创建的对象占用内存很大,则直接分配到老年代)。当 Eden 区内存不够的时候就会触发 MinorGC,对新生代区进行一次垃圾回收。
From Survivor:上一次 GC 的幸存者,作为这一次 GC 的被扫描者
To Survivor:保留了一次 MinorGC 过程中的幸存者。
JVM 每次只会使用 Eden 和其中一块 Survivor 区域来为对象服务,所以无论什么时候,总是有一块 Survivor 区域是空闲的。新生代实际可用的内存空间为 9/10(即 90%)的新生代空间。
主要存放应用程序中生命周期长的内存对象。老年代的对象比较稳定,所以 MajorGC 不会频繁执行。在进行 MajorGC 前一般都先进行了一次 MinorGC,使得有新生代的对象进入老年代,导致空间不够用才触发。当无法找到足够大的连续空间分配给新创建的较大对象时也会提前触发一次 MajorGC 进行垃圾回收以腾出空间。
MajorGC 采用 标记清除 算法:首先扫描一次所有老年代,标记出存活的对象,然后回收没有标记的对象。MajorGC 的耗时比较长,因为要扫描再回收。MajorGC 会产生内存碎片,为了减少内存损耗,一般需要进行合并或者标记出来方便下次直接分配。当老年代也满了装不下的时候,就会抛出 OOM (Out Of Memory)异常。
从 JDK1.8 开始,已经不存在永久代,替代它的一块空间叫做“元空间”,和永久代类似,都是 JVM 非法对方法区的实现,但是元空间并不在虚拟机中,而是使用本地内存,元空间的大小仅受本地内存限制。元空间的大小可以通过 -XX:MetaspaceSize
和 -XX:MaxMetaspaceSize
来指定。
好文推荐:
Spark Streaming读取Kafka数据两种方式
Spark任务调度
初识Spark执行过程 | Spark快速入门
Spark快速入门-RDD操作手册
Spark快速入门-RDD
Hive性能优化小结