上一篇文章 SpringSession:集成SpringBoot 中介绍了如何在 SpringBoot
中来集成 SpringSession
,整个过程非常简单,同时也简单分析了下 SpringSession
的作用原理。继上一篇实践之后,本文主要来分析 SpringSession
的原理。
关于 session
和 cookie
的一些知识,大家可以参考下我之前写的一篇文章: 聊一聊session和cookie 。
Session
作为服务器端使用的一种记录客户端状态的机制,其对客户端是透明的;但是 Session
的正常运作仍然需要客户端浏览器的支持。我们都知道, HTTP
协议是无状态的, Session
不能依据 HTTP
连接来判断是否为同一客户,因此服务器需要向客户端浏览器发送一个识别标志( sessionId
),这个识别标志通过是通过 Cookie
机制来完成。
当用户首次访问我们的 Servlet
时,应用服务器端会给用户创建一个独立的 Session
,并且存储在内存中。这种情况在单应用服务器场景下是可以满足的(这里不讨论其一个弊端,就是内存占用给服务器带来的压力的问题)。在集群场景下,这种机制就会到来问题:
因为是一台应用服务器,用户的每次请求都是由这台机器来处理,所以不会有 session
共享问题。
假设现在集群中有三台机器,(从上到下:A->B->C)。当前用户首次发起访问时,请求被分配到 A 机器处理, Session
数据被写入 A 机器的内存中;当再次发起访问 时,请求被分配的 B 处理,但此时 B 内存中并没有当前用户的任何数据,这样就出现了 session
不一致的情况了。
对于当前服务化、单元化应用盛行的时代,简单的内存型的 Session
已经不能够满足我们的要求了。那么我们就需要寻求一种方案来替换目前单机内存存储实现的方案。
在 1.1.2 中因为我们无法知道请求会被分配到哪台机器来处理,所以会导致 session
不一致的问题出现。如果我们可以解决让每个用户的请求能够固定的打到某一台机器上,那么上面提到的问题其实也就不存在了。 IP-HASH
就是这样一种方案。通过对请求的客户端 IP
进行 HASH
计算,并将计算结果映射到具体一台机器,这样就可以将请求固定分配到某一台机器上,从而有效的避免 session
一致性问题的出现。
这种方案的好处在于:
但是问题也很明显,这种方式实际上是规避了 session
一致性问题的出现,并非是针对 session
一致性问题给出的解决方案。主要问题:
session session HASH
这种方式的实现原理是应用服务器创建 session
之后通过组播的方式将 session
发送到组播地址内的其他应用服务器上。这种方式相较于 IP-HASH
的方式要靠谱一点:
但是这种方式也有比较大的问题:
session
会占用一定的网络资源,同时 session
在不同的机器之间进行同步存在延迟。 session
数据,对内存的消耗会随着集群的规模变大而变大,可能会导致机器频繁触发 GC
。 上面两种方式都是有服务器自己来管理 session
的,主要问题还是在于对于性能和内存的影响。而这种方式的原理是将 session
托管给三方软件(如 redis
)来统一管理。这种方式可以有效的解决性能、内存占用以及水平扩展等问题。但是因为引入了三方软件,在实现复杂度、运维成本等方面会有所增加。
目前所接触到的分布式 session
的实现方案,大多都是基于这种方式来实现的; SpringSession
也不例外。
前面对分布式场景下的 Session
一致性问题进行了说明,并对解决 Session
一致性的问题的几种策略进行的分析(有点糙,网上这些知识有很多)。在了解这些背景之后,我们来看下 SpringSession
的实现原理。
Spring Session
提供了用于管理用户会话信息的 API
和实现,在不依赖特定于应用程序容器的解决方案的情况下,使得支持群集会话变得更加简单。它还提供了透明的集成:
Tomcat
等)中立的方式替换 HttpSesseion
,支持在 headers
中提供 session IDs
来使用 RESTful API
。 WebSocket
消息时保持 HTTP
会话存活的能力 Spring WebFlux
的 WebSession
。 以上来自官网文档翻译 Spring Session
Spring Session
主要包括 4 个模块:
spring-session-core
:提供了 Spring Session
核心功能和 API
spring-session-data-redis
:以 redis
作为存储机制的 SessionRepository
实现 spring-session-hazelcast
:以 Hazelcast
作为存储机制的 SessionRepository
实现 spring-session-jdbc
:以关系型数据库作为存储机制的 SessionRepository
实现 总体来说就是 核心 API
+存储实现;工程模块截图如下:
SpringSession整体上可以分为三块:
对于常用的分布式session,在实现上一般会依赖于 cookie。但是在 springsession 中提供了基于header来传递jessionID的策略实现。同时在 2.0.4 版本之前,对于同一个浏览器同一个网站,springsession 支持多个 session
问题,但是在此版本之后抛弃了对于对 session 的支持。关于更多关于多session支持可以查看 SpringSession 的官方文档。
本文对分布式 session 的几种实现策略进行了简单的介绍。对于分布式 session 而言,如何解决一致性问题是关键,目前我见过的绝大多数方案均是以 【借助三方缓存框架实现 session 集中管理】 这种来实现的,包括本系列文章中所要介绍的 SpringSession。
除分布式session一致性方式解决方案的介绍之外,作为SpringSession 的第二篇文章,在这里简单分析了下Springsession的功能模块,以便后续展开对源码的分析。