本文基于SpringCloud-Dalston.SR5

自我保护机制

自我保护机制:默认情况下,如果Eureka Server在一定时间内没有接收到某个微服务实例的心跳,Eureka Server将会注销该实例(默认90秒)。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,以上行为可能变得非常危险了——因为微服务本身其实是健康的,此时本不应该注销这个微服务。

Eureka通过“自我保护模式”来解决这个问题——当Eureka Server节点在短时间内丢失过多客户端时(可能发生了网络分区故障),那么这个节点就会进入自我保护模式。一旦进入该模式,Eureka Server就会保护服务注册表中的信息,不再删除服务注册表中的数据(也就是不会注销任何微服务)。当网络故障恢复后,该Eureka Server节点会自动退出自我保护模式。

综上,自我保护模式是一种应对网络异常的安全保护措施。它的架构哲学是宁可同时保留所有微服务(健康的微服务和不健康的微服务都会保留),也不盲目注销任何健康的微服务。使用自我保护模式,可以让Eureka集群更加的健壮、稳定。

但是,在我们实际生产中,我们云环境同一个Region下不会发生大规模网络分区状况,所以没有启用自我保护。

整体逻辑

Spring Cloud Eureka 全解 (5) - 自我保护机制-LMLPHP

在每一个服务实例注册时:

expectedNumberOfRenewsPerMin += 2
numberOfRenewsPerMinThreshold = RenewalPercentThreshold*numberOfRenewsPerMinThreshold

无论你设置心跳时间是多少,expectedNumberOfRenewsPerMin都是+2(默认心跳时间是30s,每分钟有60s,所以+2,但是没有根据真正的心跳时间修改,应该算是个缺陷

在收到心跳时:

renewsLastMin.increment()

renewsLastMin<numberOfRenewsPerMinThreshold,就会触发自我保护,不会失效过期服务

07-06 13:03