一、概述
什么是哨兵机制
- Redis的哨兵(sentinel) 系统用于管理多个 Redis 服务器,该系统执行以下三个任务:
- 监控(Monitoring): 哨兵(sentinel) 会不断地检查你的Master和Slave是否运作正常。
- 提醒(Notification):当被监控的某个 Redis出现问题时, 哨兵(sentinel) 可以通过 API 向管理员或者其他应用程序发送通知。
- 自动故障迁移(Automatic failover):当一个Master不能正常工作时,哨兵(sentinel) 会开始一次自动故障迁移操作,它会将失效Master的其中一个Slave升级为新的Master, 并让失效Master的其他Slave改为复制新的Master; 当客户端试图连接失效的Master时,集群也会向客户端返回新Master的地址,使得集群可以使用Master代替失效Master。
- 哨兵(sentinel) 是一个分布式系统,你可以在一个架构中运行多个哨兵(sentinel) 进程,这些进程使用流言协议(gossipprotocols)来接收关于Master是否下线的信息,并使用投票协议(agreement protocols)来决定是否执行自动故障迁移,以及选择哪个Slave作为新的Master.
- 每个哨兵(sentinel) 会向其它哨兵(sentinel)、master、slave定时发送消息,以确认对方是否”活”着,如果发现对方在指定时间(可配置)内未回应,则暂时认为对方已挂(所谓的”主观认为宕机” Subjective Down,简称sdown).
- 若“哨兵群”中的多数sentinel,都报告某一master没响应,系统才认为该master"彻底死亡"(即:客观上的真正down机,Objective Down,简称odown),通过一定的vote算法,从剩下的slave节点中,选一台提升为master,然后自动修改相关配置.
- 虽然哨兵(sentinel) 释出为一个单独的可执行文件 redis-sentinel ,但实际上它只是一个运行在特殊模式下的 Redis 服务器,你可以在启动一个普通 Redis 服务器时通过给定 --sentinel 选项来启动哨兵(sentinel).
- 哨兵(sentinel) 的一些设计思路和zookeeper非常类似
二、环境配置
2.1 虚拟机
- 哨兵机制的作用:管理集群redis、监控选举策略、心跳检测,(独立的一个应用程序)
- 环境配置 实现三台不同服务器的redis实现集群(克隆)
- 直接先安装一台,后面两台全部克隆
192.168.212.145 主redis服务器
192.168.212.147 从redis
192.168.212.148 从redis
2.2 安装Redis
##下载Redis安装包
wget http://download.redis.io/releases/redis-3.2.9.tar.gz
##解压Redis安装包
tar -zxvf redis-3.2.9.tar.gz
##安装
cd redis-3.2.9
make
cd src
make install PREFIX=/usr/local/redis
##移动配置文件到安装目录下
cd ../
mkdir /usr/local/redis/etc
mv redis.conf /usr/local/redis/etc
## 修改配置文件
vi /usr/local/redis/etc/redis.conf
## 1. 修改为后台启动
daemonize yes
## 2. 修改密码
requirepass 123456
## 3. 开启外网访问 ,注释掉下面的
## bind 127.0.0.1
## 开始测试
## 1. 开启redis
/usr/local/redis/bin/redis-server /usr/local/redis/etc/redis.conf
## 2. 连接Redis客户端
./redis-cli -h 127.0.0.1 -p 6379 -a "123456"
PING #结果表示成功
## 3. 测试完成 ,停止Redis服务
./redis-cli -h 127.0.0.1 -p 6379 -a "123456" shutdown
## ☆☆☆☆注意事项☆☆☆
## 在做主动复制时要关闭Linux防火墙
##1. 临时关闭
systemctl stop firewalld
##2. 禁止开机启动防火墙
systemctl disable firewalld
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
2.3 配置主从复制
配置主从复制:将从服务器的slaveof 指向主服务器,并设置访问密码
连接客户端之后可以,输入info命令可以查看当前redis的信息,可以看出145为主服务器,148服务器为从服务器:
- 注意的地方:关闭所有防火墙
- 如果在集群的时候,之前的主redis同步密码一定要指向。集群的所有服务器都要开启密码
2.4 配置哨兵
我们在从服务器上配置哨兵:
##实现步骤:
##1.将redis根目录下的sentinel.conf 拷贝到etc目录
cp sentinel.conf /usr/local/redis/etc
##2.修改sentinel.conf配置文件,如下配置要修改:
##2.1 sentinel monitor <master-name> <ip> <port> <quorum>
## 主节点名称 IP 端口号 选举次数
## 关于<quorum> 如果设置为1 ,
## 代表至少要有 1 个哨兵认为主节点故障了,
## 才算这个主节点是 客观下线 (odown) 了
sentinel monitor mymaster 192.168.110.133 6379 1
##2.2 sentinel auth-pass <master-name> <password>
## 如果主节点设置了密码,则需要这个配置,否则哨兵无法对主节点进行监控。
sentinel auth-pass mymaster 123456
##2.3 sentinel down-after-milliseconds <master-name> <times>
## 每个哨兵节点会定期发送ping命令来判断Redis节点和其余的哨兵节点是否是可达的
## 如果超过了配置的<times>时间没有收到pong回复
## 就主观判断节点是不可达的,<times>的单位为毫秒
sentinel down-after-milliseconds mymaster 30
##2.4 sentinel parallel-syncs <master-name> <nums>
## 当哨兵节点都认为主节点故障时,哨兵投票选出的leader会进行故障转移,
## 选出新的主节点,原来的从节点们会向新的主节点发起复制,
## 这个配置就是控制在故障转移之后,每次可以向新的主节点发起复制的节点的个数,
## 最多为<nums>个,
sentinel parallel-syncs mymaster 2 # 做多少合格节点
##2.5 sentinel failover-timeout <master-name> <times>
## 这个代表哨兵进行故障转移时如果超过了配置的<times>时间就表示故障转移超时失败。
sentinel failover-timeout mymaster 5000
2.5 测试
- 启动哨兵
- 启动redis,先启动主redis,后启动从redis(不然哨兵就意味主redis挂掉了)
##1. 进入到bin目录中,启动哨兵模式
./redis-server /usr/local/redis/etc/sentinel.conf --sentinel &
- 这个时候启动了三个redis服务器,如果145主服务器挂掉了,主服务器会转移到从服务器上,如果之前的主服务器恢复了,它会变为从服务器。(如果在集群的时候,之前的主redis同步密码一定要指向。集群的所有服务器都要开启密码)
2.6 疑惑(待解决)
现在我并不知道,配置哨兵的时候是随便配置在那一台服务器上都可以,还是配置在从服务器上,而且如果有哨兵配置的服务器挂掉了,那又会发生什么呢?