前言

一点知识

按照此系列的惯例,我们先来了解下一些相关的知识。

注:以下部分内容转至大佬纯洁的微笑:熔断器Hystrix

容错处理手段

从百度百科的解释中可以看出,简单理解,所谓的容错处理其实就是捕获异常了,不让异常影响系统的正常运行,正如java中的try catch一样。

而在微服务调用中,自身异常可自行处理外,对于依赖的服务若发生错误,或者调用异常,或者调用时间过长等原因时,避免长时间等待,造成系统资源耗尽。

一般上都会通过设置请求的超时时间,如http请求中的ConnectTimeoutReadTimeout;再或者就是使用熔断器模式,隔离问题服务,防止级联错误等。

雪崩效应

下面这张图,相比大家都有看过了。

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

如图所示:A作为服务提供者,B为A的服务消费者,C和D是B的服务消费者。A不可用引起了B的不可用,并将不可用像滚雪球一样放大到C和D时,雪崩效应就形成了。也就应了那句话:星星之火,可以燎原!

熔断器

熔断器,和现实生活中的空气开关作用很像。它可以实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。

熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

可以看出,熔断器一共有三种状态,之间转换关系如下:

  • 关闭状态

    当熔断器处于关闭状态时,请求是可以被放行的;

    当熔断器统计的失败次数触发开关时,转为打开状态。
  • 打开状态

    当熔断器处于打开状态时,所有请求都是不被放行的,直接返回失败;

    只有在经过一个设定的时间窗口周期后,熔断器才会转换到半开状态
  • 半开状态

    当熔断器处于半开状态时,当前只能有一个请求被放行;

    这个被放行的请求获得远端服务的响应后,假如是成功的,熔断器转换为关闭状态,否则转换到打开状态。

个人觉得,主要还是快速失败,避免请求堆积,压垮服务器。进而起到保护服务高可用的目的。

Hystrix实践

何为Hystrix

Hystrix是有Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或第三方库,防止级联失败,从而提升系统的可用性和容错性。

Hystrix容错机制:

  • 包裹请求:使用HystrixCommand包裹对依赖的调用逻辑,每个命令在独立线程中执行,这是用到了设计模式“命令模式”。
  • 跳闸机制:当某服务的错误率超过一定阈值时,Hystrix可以自动或手动跳闸,停止请求该服务一段时间。
  • 资源隔离:Hystrix为每个依赖都维护了一个小型的线程池,如果该线程池已满,发往该依赖的请求就被立即拒绝,而不是排队等候,从而加速判定失败。
  • 监控:Hystrix可以近乎实时的监控运行指标和配置的变化。如成功、失败、超时、被拒绝的请求等。
  • 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑可自定义。
  • 自我修复:断路器打开一段时间后,会自动进入半开状态,断路器打开、关闭、半开的逻辑转换。

下图就是Hystrix的回退策略,防止级联故障。

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

常规方式整合Hystrix

创建个工程spring-cloud-hystrix工程。

0.引入POM依赖。

    <dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

1.启动类,加入注解@EnableHystrix,同时申明一个实现负载均衡的RestTemplate。(关于消费者服务可查看:第四章:服务消费者(RestTemple+Ribbon+Feign),这里不再阐述了。)

/**
* 熔断器示例
* @author oKong
*
*/
@SpringBootApplication
@EnableHystrix
@EnableDiscoveryClient
@Slf4j
public class HystrixApplication { public static void main(String[] args) throws Exception {
SpringApplication.run(HystrixApplication.class, args);
log.info("sprign-cloud-hystrix启动!");
} @Bean
@LoadBalanced
public RestTemplate restTemplat() {
return new RestTemplate();
} }

2.编写一个测试类,加入@HystrixCommand,指定fallbackMethod方法。

RibbonController.java

/**
* ribbon 常规方式-示例
* @author oKong
*
*/
@RestController
@Slf4j
public class RibbonController { @Autowired
RestTemplate restTemplate; @GetMapping("/ribbon")
@HystrixCommand(fallbackMethod="fallback")
public String hello(String name) {
log.info("使用restTemplate调用服务,参数name:{}", name);
return restTemplate.getForObject("http://eureka-client/hello?name=" + name, String.class);
} /**
* 发生熔断时调用的方法
* @param name
* @param throwable 发生异常时的异常信息
* @return
*/
public String fallback(String name,Throwable throwable) {
log.error("熔断发生了:{}", throwable);
log.warn("restTemplate调用服务发生熔断,参数name:{}", name);
return "restTemplate调用服务发生熔断,参数name:" + name;
}
}

注意:这里fallback方法加入了一个参数throwable,当发生熔断时,可以获悉发生熔断的异常信息,便于定位问题和原因。

3.启动应用,访问:http://127.0.0.1:8038/ribbon?name=oKong 。正常情况下,spring-cloud-eureka-client应用正常运行时,返回正常结果:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

现在我们停止提供者服务,再次访问,可以看见已经进入熔断方法了:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

控制台可以看见异常输出:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

由于实例尚未被剔除注册中心的服务列表,所以提示是连接超时,等待一段时间后,再次访问服务,可以看见是提示实例不存在了:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

注意:对于@HystrixCommand注解,我们可以放在任何一个调用函数里面,以此实现调用方法发生异常或者错误时,可以快速返回,避免持续请求,造成资源的耗尽。

Feign整合Hystrix

如上小节说示例的,当我们方法很多时,要是分别编写一个fallback估计也是崩溃的,虽然可以使用一个通用的fallback,但未进行特殊设置下,也是无法知道具体是哪个方法发生熔断的。

而对于Feign,我们可以使用一种更加优雅的形式进行。我们可以指定@FeignClient注解的fallback属性,或者是fallbackFactory属性,后者可以获取异常信息的。

修改spring-cloud-hystrix工程。

0.引入Feigin的POM依赖。

     <!-- feign -->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-openfeign</artifactId>
</dependency>

1.启动类,加入@EnableFeignClients启用Feign.

**
* 熔断器示例
* @author oKong
*
*/
@SpringBootApplication
@EnableHystrix
@EnableDiscoveryClient
@EnableFeignClients
@Slf4j
public class HystrixApplication { public static void main(String[] args) throws Exception {
SpringApplication.run(HystrixApplication.class, args);
log.info("sprign-cloud-hystrix启动!");
} @Bean
@LoadBalanced
public RestTemplate restTemplat() {
return new RestTemplate();
} }
  1. 创建一个服务接口类IHelloClient.java,同时定义fallback或者fallbackFactory属性值。注意:两者 同时设置时,优先调用fallbackfallbackFactory不进行调用了。
@FeignClient(name="eureka-client",/*fallback=HelloClientFailImpl.class,*/ fallbackFactory = HelloClientFallbackFactory.class)
public interface IHelloClient { /**
* 定义接口
* @param name
* @return
*/
@RequestMapping(value="/hello", method=RequestMethod.GET)
public String hello(@RequestParam("name") String name);
}
  1. 创建fallbackfallbackFactory属性对应类。

HelloClientFailImpl.java

@Component("fallback")
@Slf4j
public class HelloClientFailImpl implements IHelloClient{ @Override
public String hello(String name) {
log.error("restTemplate调用[hello]服务发生熔断,参数name:{}", name);
return "restTemplate调用[hello]服务发生熔断,参数name:" + name;
}
}

HelloClientFallbackFactory/java

@Component
@Slf4j
public class HelloClientFallbackFactory implements FallbackFactory<IHelloClient>{ @Autowired
@Qualifier("fallback")
IHelloClient helloClient; @Override
public IHelloClient create(Throwable cause) {
log.error("feign调用发生异常,触发熔断", cause);
return helloClient;
} }

可以知道,正常fallback就是一个接口的实现类,当发送异常时,会调用此接口实现类进行服务调用。而FallbackFactory是也是一个接口实现类,需要实现feign.hystrix.FallbackFactory<T>接口,在发生熔断时,调用create方法,同时返回被调用接口的实现类,以便进行fallback处理。

3.配置文件开启feign的熔断器功能。

feign.hystrix.enabled=true

或者,申明一个Feign.Builder类也是可以的,我们从org.springframework.cloud.openfeign.FeignClientsConfiguration可以看出,启用feign的条件:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

所以正常,我们只需要在配置文件中加入feign.hystrix.enabledtrue即可,注意:此属性在IDE下未进行提示的。

或者就如此类一样,申明一个bean:

@Bean
public Feign.Builder feignHystrixBuilder() {
return HystrixFeign.builder();
}

也是可以的。

4.编写一个测试类FeignController

/**
* feign 熔断器示例
* @author oKong
*
*/
@RestController
@Slf4j
public class FeignController { @Autowired
IHelloClient helloClient; @GetMapping("/feign")
public String hello(String name) {
log.info("使用feign调用服务,参数name:{}", name);
return helloClient.hello(name);
} }

5.再次启动应用,访问:http://127.0.0.1:8038/feign?name=oKong ,正常调用如下:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

关闭服务提供者,再次访问,浏览器返回了错误提示:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

同时,我们使用了FallbackFactory,控制台打印出了具体异常:

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP


针对熔断超时时间等相关设置,可以通过@HystrixCommand注解的各属性进行配置,主要还是commandProperties属性值,具体的参数可查看com.netflix.hystrix.HystrixCommandProperties类,也可以针对某个调用方法进行特殊设置。具体的可以看看这篇文章:hystrix的基本介绍和配置属性说明,或者可以去大佬程序员DD博客查阅下关于 Hystrix相关知识点:服务容错保护(Hystrix断路器)【Dalston版】服务容错保护(Hystrix依赖隔离)【Dalston版】,版本虽然是D版的,但原理是差不多的~


参考资料

  1. http://www.ityouknow.com/springcloud/2017/05/16/springcloud-hystrix.html

  2. https://cloud.spring.io/spring-cloud-static/Finchley.SR1/single/spring-cloud.html#_circuit_breaker_hystrix_clients

总结

最后

老生常谈

  • 个人QQ:499452441
  • 微信公众号:lqdevOps

白话SpringCloud | 第五章:服务容错保护(Hystrix)-LMLPHP

个人博客:http://blog.lqdev.cn

源码示例:https://github.com/xie19900123/spring-cloud-learning

原文地址:http://blog.lqdev.cn/2018/09/23/SpringCloud/chapter-five/

05-11 11:12