Paxos算法是基于消息传递且具有高度容错特性的一致性算法。我们将从一个简单的问题开始,逐步的改进我们的设计方案,最终得到Paxos,一个可以在逆境下工作的协议。
一、客户端-服务器模型
我们从最小的分布式系统开始,在这个系统中,只有两个结点,客户端结点与服务端结点,客户端结点能够操作(存储或更新)远程服务器结点上的数据。
算法1.1 朴素的客户端/服务器算法:客户端每次向服务器发送一条命令。
在存在消息丢失的消息传递模型中,该算法却不能很好的工作,客户端不能确认消息是否正确的被服务器所接受。因此我们需要对其进行一些小的改进。
算法1.2 待确认的客户端/服务器算法
1.客户端向服务端发送一条请求命令消息。
2.服务端接受请求并回复确认信息。
3.客户端在一定的时间范围内,没有收到服务器端发送的请求确认信息的回复,则重新发送命令请求信息。
- 该算法描述了,客户端在发送一条请求命令后,在收到服务端的确认回复前,是不会发送下一条请求命令。
- 客户端在发送的过程中消息可能丢失,服务端在回复的确认消息时,消息也可能丢失,对于服务端确认消息的丢失情况,在到达一定超时时间后,客户端未收到确认回复,会重新发送消息,此时该消息已经被服务器端处理,所以我们需要有一种机制能够保证消息的幂等性。例如给消息加上序列号。
- 该算法可以很容易的扩展到多服务器端的场景,客户端发送命令请求给每一个服务器端,当收到所有服务器的确认消息,就可以认为这条命令执行成功。
- 如何处理多个客户端的场景?
定理1.1 如果算法在多个客户端与服务端运行,服务器收到的命令顺序可能是不同的,这会导致不一致的状态。
假设在如下的场景中,存在客户端c1,c2 ,服务端 s1,s2. 服务端s1,s2存在相同的值x = 0。 如果此时 c1,向服务器s1,s2 发送 x = x + 1. 在同一时刻 c2 向服务器 s1,s2 发送 x = 2*x. 假设c1 先于 c2 到达 s1 ,则此时s1的状态值x为 2, 而 c2 先于 c1 到达 s2 , 则此时 s2 的状态值x为 1. 导致集群的状态不一致。
定义1.1 (状态复制)对于一组结点,如果所有结点都以相同的顺序执行命令序列 c1,c2,c3,c4……,则这组结点实现了状态复制
- 状态复制是分布式系统的基本特征
- 因为单个系统天然实现状态复制,可以令单个服务器系统实现序列化器,自动对请求进行排序来分发命令,从而实现状态复制。
算法1.3 借助单一的串行化器实现状态复制
1. 所有的客户端将请求命令发送到串行化器
2.串行化器逐个处理客户端请求,并将客户端请求逐个发送给所有服务器
3.当串行化器接受到所有服务器的确认消息时,它将返回给对应客户端命令执行成功的消息。
- 这个想法有时也被成为主从复制。
- 改算法存在单点故障。串行化器
- 我们是否可以构造一个更分布式的方法来解决状态复制的问题。去掉串行化器。任何时刻最多只有一个结点可以发送请求命令,是否可以采用互斥或各自加锁的思想?
算法 1.4 两阶段锁
阶段 1 :
客户端向所有服务器请求获取锁
阶段 2:
if 客户端获得所有服务器的加锁请求
客户端以可靠的方式向所有服务器发送命令请求,释放锁
else
客户端释放已经获取的锁,休眠一段时间,进入阶段 1
- 算法 1.4 是否能够很好的应对结点崩溃呢?在该算法中要求所有的服务器结点都必须能够正常的工作
- 如果仅获取部分服务器的锁能否工作,获得过半数服务器的锁是否就足够了?
- 如果超过两个以上的客户端试图获取超过半数服务器的锁,怎么应对死锁的问题,是否需要释放已经获取的服务器锁,如果客户端在释放锁之前就发生了故障,怎么办,是否需要一个与锁不同的概念。