看过这篇文章,大厂面试你「双亲委派模型」,硬气的说一句,你怕啥?
文章内容相对较长,所以添加了目录,如果你希望对 Java 的类加载过程有个更深入的了解,同时增加自己的面试技能点,请耐心读完......
在介绍这个Java技术点之前,先试着思考以下几个问题:
想理解以上几个问题的前提是了解类加载时机与过程, 这篇文章将会以非常详细的解读方式来回答以上几个问题
类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中准备、验证、解析3个部分统称为连接(Linking)。如图所示
加载、验证、准备、初始化和卸载这5个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定:它在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定(也称为动态绑定或晚期绑定)
在加载阶段(可以参考java.lang.ClassLoader的loadClass()方法),虚拟机需要完成以下3件事情:
加载阶段和连接阶段(Linking)的部分内容(如一部分字节码文件格式验证动作)是交叉进行的,加载阶段尚未完成,连接阶段可能已经开始,但这些夹在加载阶段之中进行的动作,仍然属于连接阶段的内容,这两个阶段的开始时间仍然保持着固定的先后顺序。
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
验证阶段大致会完成4个阶段的检验动作:
验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。这时候进行内存分配的仅包括类变量(被static修饰的变量),而不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在堆中。其次,这里所说的初始值 通常情况 下是数据类型的零值,假设一个类变量的定义为:
有 通常情况 就有 特殊情况 ,这里的特殊是指:
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。
在介绍初始化时,要先介绍两个方法: <clinit>
和 <init>
:
clinit> <init>
类初始化阶段是类加载过程的最后一步,到了初始化阶段,才真正开始执行类中定义的java程序代码。在准备极端,变量已经付过一次系统要求的初始值,而在初始化阶段,则根据程序猿通过程序制定的主管计划去初始化类变量和其他资源,或者说:初始化阶段是执行类构造器 <clinit>()
方法的过程.
<clinit>()
方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块 static{} 中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序所决定的,静态语句块只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块可以赋值,但是不能访问。如下:
那么去掉报错的那句,改成下面:
输出结果:1
为什么输出结果是 1,在准备阶段我们知道 i=0,然后类初始化阶段按照顺序执行,首先执行 static 块中的 i=0,接着执行 static赋值操作i=1, 最后在 main 方法中获取 i 的值为1
<clinit>
()方法与实例构造器 <init>()
方法不同,它不需要显示地调用父类构造器,虚拟机会保证在子类 <init>()
方法执行之前,父类的 <clinit>()
方法方法已经执行完毕 <clinit>()
方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。 <clinit>()
方法对于类或者接口来说并不是必需的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生产 <clinit>()
方法。 <clinit>()
方法。但接口与类不同的是,执行接口的 <clinit>()
方法不需要先执行父接口的 <clinit>()
方法。只有当父接口中定义的变量使用时,父接口才会初始化。另外,接口的实现类在初始化时也一样不会执行接口的 <clinit>()
方法。 <clinit>()
方法在多线程环境中被正确的加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的 <clinit>()
方法,其他线程都需要阻塞等待,直到活动线程执行 <clinit>()
方法完毕。如果在一个类的 <clinit>()
方法中有耗时很长的操作,就可能造成多个线程阻塞,在实际应用中这种阻塞往往是隐藏的。 让我们来验证上面的加载规则
验证 1: 虚拟机会保证在子类 <init>()
方法执行之前,父类的 <clinit>()
方法方法已经执行完毕
输出结果
SSClass SuperClass init! 123
验证 2: 通过数组定义来引用类,不会触发此类的初始化(我的理解是数组的父类是Object)
验证 3:常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化
输出结果:
hello world
验证小结
虚拟机规范严格规定了有且只有5中情况(jdk1.7)必须对类进行“初始化”(而加载、验证、准备自然需要在此之前开始):
有了这个加载规则的印象,双亲委派模型就很好理解了,别着急,继续向下看, 你会发现你的理解层面提高了
刚看到这个词汇的时候我是完全懵懂的状态,其实就是定义了 JVM 启动的时候类的加载规则, 大家要按规矩办事,好办事,来看下图:
所谓双亲委派是指每次收到类加载请求时,先将请求委派给父类加载器完成(所有加载请求最终会委派到顶层的Bootstrap ClassLoader加载器中),如果父类加载器无法完成这个加载(该加载器的 搜索范围 中没有找到对应的类),子类尝试自己加载, 如果都没加载到,则会抛出 ClassNotFoundException 异常, 看到这里其实就解释了文章开头提出的第一个问题,父加载器已经加载了JDK 中的 String.class 文件,所以我们不能定义同名的 String java 文件。
为什么会有这样的规矩设定?
因为这样可以避免重复加载,当父亲已经加载了该类的时候,就没有必要 ClassLoader 再加载一次。考虑到安全因素,我们试想一下,如果不使用这种委托模式,那我们就可以随时使用自定义的String来动态替代java核心api中定义的类型,这样会存在非常大的安全隐患,而双亲委托的方式,就可以避免这种情况,因为String 已经在启动时就被引导类加载器(Bootstrcp ClassLoader)加载,所以用户自定义的ClassLoader永远也无法加载一个自己写的String,除非你改变 JDK 中 ClassLoader 搜索类的默认算法。
我们发现除了启动类加载器(BootStrap ClassLoader),每个类都有其"父类"加载器
:warning: 其实这里的父子关系是组合模式,不是继承关系来实现
从图中可以看到类 AppClassLoader 和 ExtClassLoader 都继承 URLClassLoader , 而 URLClassLoader 又继承 ClassLoader , 在 ClassLoader 中有一个属性
在通过构造函数实例化 AppClassLoader 和 ExtClassLoader 的时候都要传入一个 classloader 作为当前 classloader 的 parent
顶层ClassLoader有几个函数很关键,先有个印象
指定保护域(protectionDomain),把ByteBuffer的内容转换成 Java 类,这个方法被声明为final的
把字节数组 b中的内容转换成 Java 类,其开始偏移为off,这个方法被声明为final的
查找指定名称的类
链接指定的类
上面我们提到每个加载器都有对应的加载搜索范围
大家自行运行这个文件,就可以看到每个类加载器加载的文件了
通常用这两种方式来动态加载一个 java 类, Class.forName() 与 ClassLoader.loadClass() 但是两个方法之间也是有一些细微的差别
Class.forName() 方式
查看Class类的具体实现可知,实质上这个方法是调用原生的方法:
形式上类似于Class.forName(name,true,currentLoader)。 综上所述,Class.forName 如果调用成功会:
ClassLoader.loadClass方式
如果采用这种方式的类加载策略,由于双亲托管模型的存在,最终都会将类的加载任务交付给Bootstrap ClassLoader进行加载。跟踪源代码,最终会调用原生方法:
与此同时,与上一种方式的最本质的不同是,类不会被初始化,只有显式调用才会进行初始化。综上所述,ClassLoader.loadClass 如果调用成功会:
分析类加载器源码要从 sun.misc.Launcher.class 文件看起, 关键代码已添加注释,同时可以在此类中看到 ExtClassLoader 和 AppClassLoader 的定义,也验证了我们上文提到的他们不是继承关系,而是通过指定 parent 属性来形成的组合模型
进入上面第25行的 loadClass 方法中
我们看到方法有同步块(synchronized), 这也就解释了文章开头第2个问题,多线程情况不会出现重复加载的情况。同时会询问parent classloader是否有加载,如果没有,自己尝试加载。
URLClassLoader中的 findClass方法:
借用网友的一个加载时序图来解释整个过程更加清晰:
Java本身有一套资源管理服务JNDI,是放置在rt.jar中,由启动类加载器加载的。以对数据库管理JDBC为例,java给数据库操作提供了一个Driver接口:
然后提供了一个DriverManager来管理这些Driver的具体实现:
这里省略了大部分代码,可以看到我们使用数据库驱动前必须先要在DriverManager中使用registerDriver()注册,然后我们才能正常使用。
我们看下mysql的驱动是如何被加载的:
核心就是这句Class.forName()触发了mysql驱动的加载,我们看下mysql对Driver接口的实现:
可以看到,Class.forName()其实触发了静态代码块,然后向DriverManager中注册了一个mysql的Driver实现。这个时候,我们通过DriverManager去获取connection的时候只要遍历当前所有Driver实现,然后选择一个建立连接就可以了。
在JDBC4.0以后,开始支持使用spi的方式来注册这个Driver,具体做法就是在mysql的jar包中的META-INF/services/java.sql.Driver 文件中指明当前使用的Driver是哪个,然后使用的时候就直接这样就可以了:
可以看到这里直接获取连接,省去了上面的Class.forName()注册过程。
现在,我们分析下看使用了这种spi服务的模式原本的过程是怎样的:
好了,问题来了,Class.forName()加载用的是调用者的Classloader,这个调用者DriverManager是在rt.jar中的,ClassLoader是启动类加载器,而com.mysql.jdbc.Driver肯定不在<JAVA_HOME>/lib下,所以肯定是无法加载mysql中的这个类的。这就是双亲委派模型的局限性了,父级加载器无法加载子级类加载器路径中的类。
那么,这个问题如何解决呢?按照目前情况来分析,这个mysql的drvier只有应用类加载器能加载,那么我们只要在启动类加载器中有方法获取应用程序类加载器,然后通过它去加载就可以了。这就是所谓的线程上下文加载器。
文章前半段提到线程上下文类加载器可以通过 Thread.setContextClassLoaser() 方法设置,如果不特殊设置会从父类继承,一般默认使用的是应用程序类加载器
现在我们看下DriverManager是如何使用线程上下文类加载器去加载第三方jar包中的Driver类的,先来看源码:
使用时,我们直接调用DriverManager.getConnection() 方法自然会触发静态代码块的执行,开始加载驱动然后我们看下ServiceLoader.load()的具体实现:
继续向下看构造函数实例化 ServiceLoader 做了哪些事情:
查看 reload() 函数:
继续查看LazyIterator构造器,该类同样实现了Iterator接口:
实例化到这里我们也将上下文得到的类加载器实例化到这里,来回看ServiceLoader 重写的 iterator() 方法:
上面next() 方法调用了lookupIterator.next(),这个lookupIterator 就是刚刚实例化的 LazyIterator(); 来看next方法
继续查看nextService 方法:
终于到这里了,在上面 nextService函数中第8行调用了c = Class.forName(cn, false, loader) 方法,我们成功的做到了通过线程上下文类加载器拿到了应用程序类加载器(或者自定义的然后塞到线程上下文中的),同时我们也查找到了厂商在子级的jar包中注册的驱动具体实现类名,这样我们就可以成功的在rt.jar包中的DriverManager中成功的加载了放在第三方应用程序包中的类了同时在第16行完成Driver的实例化,等同于new Driver(); 文章开头的问题在理解到这里也迎刃而解了
首先谈一下何为热部署(hotswap),热部署是在不重启 Java 虚拟机的前提下,能自动侦测到 class 文件的变化,更新运行时 class 的行为。Java 类是通过 Java 虚拟机加载的,某个类的 class 文件在被 classloader 加载后,会生成对应的 Class 对象,之后就可以创建该类的实例。默认的虚拟机行为只会在启动时加载类,如果后期有一个类需要更新的话,单纯替换编译的 class 文件,Java 虚拟机是不会更新正在运行的 class。如果要实现热部署,最根本的方式是修改虚拟机的源代码,改变 classloader 的加载行为,使虚拟机能监听 class 文件的更新,重新加载 class 文件,这样的行为破坏性很大,为后续的 JVM 升级埋下了一个大坑。
另一种友好的方法是创建自己的 classloader 来加载需要监听的 class,这样就能控制类加载的时机,从而实现热部署。
热部署步骤:
JVM中的Class只有满足以下三个条件,才能被GC回收,也就是该Class被卸载(unload):
要创建用户自己的类加载器,只需要继承java.lang.ClassLoader类,然后覆盖它的findClass(String name)方法即可,即指明如何获取类的字节码流。
非常感谢以下博文的作者,通过反复拜读来了解双亲委派模型的原理
后续会出一系列文章点亮上图,同时进行 Spring 知识点解释与串联,在工作中充分利用 Spring 的特性
另外,还会推出 Java 多线程与 ElasticSearch 相关内容
阅读原文