内容目录:

  • Sentinel 如何工作的?

  • 核心配置项

  • 怎么选出新 master 的?

  • Sentinel 有多个,具体谁来执行故障转移?

  • Sentinel 是怎么发现 slave 和其他 sentinel 的?

  • 故障转移后 client 怎么知道新的master地址?

Redis Sentinel 为 Redis 提供了一个简单的自动化的高可用机制。

Redis Sentinel 的目标是通过3个功能来管理 Redis:

  • 监控 Redis 的健康情况
  • 出现错误后发送通知,例如通知客户端
  • 自动创建一个新的 master 并执行故障转移

如何工作的?

例如一个 master 复制到 N 个 slave,同时运行了多个 sentinel。

如果一个 sentinel 检测到了 master 没有响应,那么它会广播一个 SDOWN(自己主观认为的) 消息给其他 sentinel。

当指定数量的 sentinel 都认为 master 宕了,那么这就成为了事实,ODOWN(客观真实的) 消息会被广播。

之后,一个新的 master 会被选出来,这一切对于 redis 的客户端都是透明的。

我们通过一个示例场景更清楚的看一下:

Redis A 是 master,Redis B、C 是 slave。

有3个 sentinel 运行在应用服务器上。

这时,A 宕了,被一个 sentinel 发现了,发出了 SDOWN 消息,之后,其他 sentinel 也发现了,那么 ODOWN 消息被发出。

选举新的 master,例如 B。

C 改为复制 B,客户端也改为连接 B。

之后如果 A 恢复了,那么也会成为 B 的 slave。

核心配置项

sentinel monitor myHAsetup 192.168.1.29 6379 2

ip port 是指定监控目标的地址和端口。
最后的 2 是指定最少几个 sentinel 认为 master 宕了才是真的宕了。
myHAsetup 是自定义的 master 组名。

sentinel down-after-milliseconds myHAsetup 6001

指定认为 master 故障的毫秒数。

sentinel failover-timeout myHAsetup 60000

执行故障转移的过期时间,超时后,其他 sentinel 就会申请去执行故障转移。

sentinel parallel-syncs myHAsetup 1

故障转移之后,同时同步新 master 的 slave 的数量。

怎么选出新 master 的?

sentinel 选择新的 master 的原则:

  • 首先判断优先级,选择优先级较小的

优先级是在配置文件中配置的,默认为 100

  • 如果优先级相同,选择复制 offset 更大的

slave 与 master 同步后,offset 会自动增加。

  • 如果复制下标也相同,就选择 runid 小的

每个 Redis 实例都会有一个 runid,是在启动时设置的随机字符串。

sentinel 有多个,具体谁来执行故障转移?

多个 sentinel 会选出一个 leader,具体的选举机制是依据 Raft 分布式一致性协议。

sentinel 是怎么发现 slave 和其他 sentinel 的?

通过上面的配置文件可以发现,只配置了 Redis master 的地址,并没有配置 slave 和其他 sentinel 的地址。

那是怎么知道的呢?

发现 slave 比较简单,通过询问 master 就可以得到 slave 的地址。

发现其他 sentinel 是通过“发布/订阅”机制实现的。

每个 sentinel 都会向 __sentinel__:hello 这个频道发送消息,每秒一次,报告自己的存在。

每个 sentinel 也会订阅这个频道,就可以发现其他的 sentinel 了。

故障转移后 client 怎么知道新的master地址?

sentinel 就像是一个服务注册中心,可以请求 sentinel 获取当前的 master 信息。

例如:

redis-cli -p 26379 -h 192.168.1.29 sentinel get-master-addr-by-name myHAsetup
"192.168.1.29"
"6379"

client 使用的 Redis 客户端需要支持 sentinel,那么就可以自动拿到 master 的地址了。

12-13 05:34