本文会探究下SpringBoot的启动原理。SpringBoot在打包的时候会将依赖包也打进最终的Jar,变成一个可运行的FatJar。也就是会形成一个Jar in Jar的结构。默认情况下,JDK提供的ClassLoader只能识别Jar中的class文件以及加载classpath下的其他jar包中的class文件。对于在jar包中的jar包是无法加载的。
java中描述资源常使用URL。而URL有一个方法用于打开链接 java.net.URL#openConnection()
。由于URL用于表达各种各样的资源,打开资源的具体动作由 java.net.URLStreamHandler
这个类的子类来完成。根据不同的协议,会有不同的handler实现。而JDK内置了相当多的handler实现用于应对不同的协议。比如 jar
、 file
、 http
等等。URL内部有一个静态 HashTable
属性,用于保存已经被发现的协议和handler实例的映射。
获得 URLStreamHandler
有三种方法
URLStreamHandlerFactory
接口,通过方法 URL.setURLStreamHandlerFactory
设置。该属性是一个静态属性,且只能被设置一次。 URLStreamHandler
的子类,作为URL的构造方法的入参之一。但是在JVM中有固定的规范要求: java.protocol.handler.pkgs
系统属性,如果有多个实现类,那么中间用 | 隔开。因为JVM在尝试寻找Handler时,会从这个属性中获取包名前缀,最终使用 包名前缀.协议名.Handler
,使用 Class.forName
方法尝试初始化类,如果初始化成功,则会使用该类的实现作为协议实现。
SpringBoot定义了一个接口用于描述资源,也就是 org.springframework.boot.loader.archive.Archive
。该接口有两个实现,分别是 org.springframework.boot.loader.archive.ExplodedArchive
和 org.springframework.boot.loader.archive.JarFileArchive
。前者用于在文件夹目录下寻找资源,后者用于在jar包环境下寻找资源。而在SpringBoot打包的fatJar中,则是使用后者。
SpringBoot使用插件
<plugin> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-maven-plugin</artifactId> <configuration> <mainClass>com.tccdemo.Eureka</mainClass> </configuration> </plugin> 复制代码
进行打包,打包后的文件布局如下:
来看描述文件 MANIFEST.MF
的内容
Manifest-Version: 1.0
Implementation-Title: eureka
Implementation-Version: 1.0-SNAPSHOT
Built-By: Administrator
Implementation-Vendor-Id: com.tccdemo
Spring-Boot-Version: 2.0.2.RELEASE
Main-Class: org.springframework.boot.loader.JarLauncher
Start-Class: com.tccdemo.Eureka
Spring-Boot-Classes: BOOT-INF/classes/
Spring-Boot-Lib: BOOT-INF/lib/
Created-By: Apache Maven 3.6.1
Build-Jdk: 1.8.0_201
Implementation-URL: http://www.example.com
复制代码
最为显眼的就是程序的启动类并不是我们项目的启动类,而是SpringBoot的 JarLauncher
。下面会来深究下这个类的作用。
首先来看启动方法
public static void main(String[] args) throws Exception { new JarLauncher().launch(args); } 复制代码
JarLauncher
继承于 org.springframework.boot.loader.ExecutableArchiveLauncher
。该类的无参构造方法最主要的功能就是构建了当前main方法所在的FatJar的 JarFileArchive
对象。下面来看launch方法。该方法主要是做了2个事情:
MANIFEST.MF
文件中 Start-Class
指向的业务类,并且执行静态方法main。进而启动整个程序。
通过静态方法 org.springframework.boot.loader.JarLauncher#main
就可以顺利启动整个程序。这里面的关键在于SpringBoot自定义的classLoader能够识别FatJar中的资源,包括有:在指定目录下的项目编译class、在指令目录下的项目依赖jar。JDK默认用于加载应用的AppClassLoader只能从jar的根目录开始加载class文件,并且也不支持jar in jar这种格式。
为了实现这个目标,SpringBoot首先从支持jar in jar中内容读取做了定制,也就是支持多个 !/
分隔符的url路径。SpringBoot定制了以下两个方面:
java.net.URLStreamHandler
的子类 org.springframework.boot.loader.jar.Handler
。该Handler支持识别多个 !/
分隔符,并且正确的打开 URLConnection
。打开的Connection是SpringBoot定制的 org.springframework.boot.loader.jar.JarURLConnection
实现。 java.net.JarURLConnection
的子类 org.springframework.boot.loader.jar.JarURLConnection
。该链接支持多个 !/
分隔符,并且自己实现了在这种情况下获取InputStream的方法。而为了能够在 org.springframework.boot.loader.jar.JarURLConnection
正确获取输入流,SpringBoot自定义了一套读取ZipFile的工具类和方法。这部分和ZIP压缩算法规范紧密相连,就不深入了。
能够读取多个 !/
的url后,事情就变得很简单了。上文提到的 ExecutableArchiveLauncher
的 launch
方法会以当前的FatJar构建一个 JarFileArchive
,并且通过该对象获取其内部所有的资源URL,这些URL包含项目编译class和依赖jar包。在构建这些URL的时候传入的就是SpringBoot定制的Handler。将获取的URL数组作为参数传递给自定义的ClassLoader org.springframework.boot.loader.LaunchedURLClassLoader
。该ClassLoader继承自UrlClassLoader。UrlClassLoader加载class就是依靠初始参数传入的Url数组,并且尝试Url指向的资源中加载Class文件。有了自定义的Handler,再从Url中尝试获取资源就变得很容易了。
至此,SpringBoot自定义的ClassLoader就能够加载FatJar中的依赖包的class文件了。
SpringBoot提供了一个很好的思路,但是其内部实现非常复杂,特别是其自行实现了一个ZipFIle的解析器。但是本质上这些背后的工作都是为了能够读取到FatJar内部的Jar的class文件资源。也就是只要有办法能够读取这些资源其实就可以实现加载Class文件了。而依靠JDK本身提供的JarFile其实就可以做到了。而读取到所有资源后,自定义一个ClassLoader加载读取到二进制数据进而定义Class对象并不是很难的项目实现。当然,SpringBoot定制的Zip解析可以在加载类阶段避免频繁的文件解压动作,在性能上良好一些。
文章原创首发于公众号:林斌说Java,转载请注明来源,谢谢。
欢迎扫码关注