多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”
熔断机制是应对雪崩效应的一种微服务链路保护机制。当扇出链路的某个微服务不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。 在Spring Cloud框架里,熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阈值,缺省是5秒内20次调用失败,就会启动熔断机制。熔断机制的注解是@HystrixCommand。
在Hystrix里面,熔断又分为三种情况:半熔断、熔断打开、熔断关闭
涉及到断路器的三个重要参数:快照时间窗、请求总数阀值、错误百分比阀值。
对于这一问题,hystrix也为我们实现了自动恢复功能。
当断路器打开,对主逻辑进行熔断之后,hystrix会启动一个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,当休眠时间窗到期,断路器将进入半开状态,释放一次请求到原来的主逻辑上,如果此次请求正常返回,那么断路器将继续闭合,主逻辑恢复,如果这次请求依然有问题,断路器继续进入打开状态,休眠时间窗重新计时。
Hystrix提供了两种隔离策略:线程池隔离和信号量隔离,默认采用线程池隔离。
Hystrix使用舱壁模式来实现线程池的隔离,它会为每一个Hystrix命令创建一个独立的线程池,不同服务通过使用不同线程池,彼此间将不受影响,这样就算某个在Hystrix命令包装下的依赖服务出现延迟过高的情况,也只是对该依赖服务的调用产生影响,而不会拖慢其他的服务
这种方式需要为每个依赖的服务申请线程池,有一定的资源消耗;通过线程池大小可以控制并发量,当线程池饱和时可以提前拒绝服务,防止依赖问题扩散。建议线程池不要设置过大,否则大量堵塞线程有可能会拖慢服务器
1:应用自身得到完全的保护,不会受不可控的依赖服务影响。
2:可以有效的降低接入新服务的风险
3:当依赖的服务从失效恢复正常后,它的线程池会被清理并且能够马上恢复健康的服务,相比之下容器级别的清理恢复速度要慢得多。
4:当依赖的服务出现配置错误的时候,线程池会快速的反应出此问题(通过失败次数、延迟、超时、拒绝等指标的增加情况)。同时,可以在不影响应用功能的情况下通过实时的动态属性刷新来处理它。
5:当依赖的服务因实现机制调整等原因造成其性能出现很大变化的时候,此时线程池的监控指标信息会反映出这样的变化。同时,可以通过实时动态刷新自身应用对依赖服务的阈值进行调整以适应依赖方的改变。
信号隔离与线程隔离最大不同在于执行依赖代码的线程依然是请求线程;而线程池方式下业务请求线程和执行依赖的服务的线程不是同一个线程