分布式系统面临的问题
复杂的分布式体系结构中的应用程序有数十个依赖关系, 每个依赖关系在某些时刻不可避免的失败。
服务雪崩效应
多个微服务调用的时候, 假设微服务A调用微服务B和微服务C, 微服务B和微服务C又调用其它的微服务, 这就是所谓的"扇出"。如果扇出的链路上某个微服务的调用响应时间过长或不可用, 对微服务A的调用就会占用越来越多的系统资源, 进而引起系统崩溃, 即服务雪崩效应。
对高流量的服务来说, 单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是, 这些应用程序还可能导致服务之间的延迟增加, 备份队列, 线程和其他系统资源紧张, 导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理, 以便单个依赖关系的失败, 不影响整个应用程序或系统。
Hystrix概述
Hystrix是一个用于处理分布式系统的延迟和容错的开源库, 在分布式系统里, 许多依赖不可避免的会调用失败, 比如异常、超时等, Hystrix能够保证在一个依赖出问题的情况下, 不会导致整体服务失败, 避免级联故障, 以提高分布式系统的弹性。
"熔断器"本身是一种开关装置, 当某个服务单元发生故障后, 通过断路器的故障监控, 向调用方返回一个符合预期的、可处理的备选响应(FallBack), 而不是长时间的等待或抛出调用方无法处理的异常, 这样就保证了服务调用方的线程不会被长时间, 不必要的占用, 从而避免了故障在分布式系统中的蔓延, 乃至雪崩。
服务熔断
熔断机制是应对雪崩效应的一种微服务链路保护机制。
当扇出链路的某个微服务不可用或者响应时间过长时, 会进行服务降级, 进而熔断该节点微服务的调用, 快速返回"错误"的相应信息。当检测到该节点微服务调用相应正常后回复调用链路。SpringCloud框架里熔断机制是通过Hystrix来实现的。Hystrix会监控微服务间调用的情况, 当失败的调用到一定阈值, 却省是5秒内调用20次调用失败就会启动熔断机制。熔断机制的注解是@HystrixCommand。
搭建Hystrix熔断器
根据microservicecloudproviderdept8001创建hystrix熔断服务
添加pom依赖包
修改application.yml
修改Controller控制层
在接口方法上添加@HystrixCommand注解, fallbackMethod属性设置为符合预期、可处理的备选响应方法名称。
添加备选响应方法。
修改启动类
在启动类上面添加@EnableCircuitBreaker注解, 启用对Hystrix熔断服务的支持。
测试
服务降级
整体资源不足, 将其余不重要的服务先关掉, 等资源重组时再开启。
修改microservicecloudconsumerdeptfeign中的application.yml
修改microservicecloudapi
添加DeptClientServiceFallbackFactory类, 注意必须添加@Component注解, 将其加入容器中管理。
修改DeptClientService类
清理microservicecloudapi
测试
启动服务: microservicecloudeureka7001、microservicecloudeureka7002、microservicecloudeureka7003、microservicecloudproviderdept8001、microservicecloudconsumerdeptfeign
关闭microservicecloudproviderdept8001服务
服务监控HystrixDashboard
概述
除了隔离以来服务的调用外, Hystrix还提供了准实时的调用监控(HystrixDashboard), Hystrix会持续的记录所有通过Hystrix发起请求的执行信息, 并以统计报表和图形的形式展示给用户, 包括每秒执行多少请求, 多少成功, 多少失败等。Netflix通过Hystrix-metrics-event-stream项目实现了对以上指标的监控。Spring Cloud 也提供了Hystrix Dashboard的整合, 对监控内容转化成可视化界面。
创建microservicecloud-consumer-hystrix-dashboard
添加pom依赖
添加application.xml
添加启动类, 在启动类上添加@EnableHystrixDashboard注解
测试
浏览器输入http://localhost:9001/hystrix进行测试, 出现如下界面说明成功。
Hystrix Dashboard使用
Delay
该参数用来控制服务器上轮训监控信息的延迟时间, 默认为2000毫秒, 可以通过配置该属性来降低客户端的网络和CPU消耗。
Title
该参数对应了头部标题Hystrix Stream之后的内容, 默认会使用具体监控实例的URL, 可以通过配置该信息来展示更合适的标题。
查看
- 七色:
- 一圈:实心圆, 共有两种含义。他通过颜色的变化代表了实例的健康程度, 它的健康度从绿色>黄色>橙色>红色递减。该实心圆除了颜色的变化之外, 它的大小也会根据额实例的请求流量发生变化, 流量越大该实心圆越大。所以通过该实心圆的展示, 就可以在大量的实例中快速的发现故障实例和高压实例。
- 一线:曲线, 用来记录2分钟内流量的相对变化, 可以通过它来观察到流量的上升和下降趋势。
启动工程
microservicecloudeureka7001, microservicecloudeureka7002, microservicecloudeureka7003, microservicecloudproviderdepthystrix8001, microservicecloudconsumerhystrixdashboard
若microservicecloudconsumerhystrixdashboard已经启动, 无需再启。
使用Hystrix Dashboard
成功案例
在浏览器输入http://localhost:8001/dept/get/1, F5猛刷: