MySQL Galera集群和ORACLE RAC的实现原理比较

MySQL Galera集群和ORACLE RAC的实现原理比较

MySQL Galera(以下简称MG)是通shared nothing结构，整个cluster中每个节点都有一个单独的数据拷贝.而
RAC是shared everything的结构，集群中所有的结点共享一份数据.

对于MG中的一条数据修改，必须要有一定的手段传播到其他的节点上，这个过程通过分发binlog来实现.而RAC是
只有一份数据，所以不需要对修改的数据传播到其他节点的开销.

MG采用了两阶段提交协议，在一个节点上对事务进行提交之前，需要在其他的节点进行相应的提交请交，等
到其他节点上都准备好了以后，再开始提交.而RAC没有这种开销或是开销极少。因此事务响应的时候受网络或
其他节点的影响较大.

对IO的开销，我们知道MG是通过同步复制实现集群的数据一致性，假设一个事务写一次磁盘操作,集群中有三个
节点，而每一次提交一个事务都会在每个节点上产生一次IO操作，整个集群的IO开销是3次,而在RAC中，只需要1次
IO操作就可以了。这也是造成MG的开销很大的基本原因。使MG的集群并不能很好的进行写扩展,同时也使整个MG的
性能受到最差配置的节点的影响.

因此我更愿意把MG看作是一种高可用性的方案，比如某系统对高可用性要求非常高，这时候做两个到三节点的
集群，平常只在一个节点上写入，而其他的节点做成只读查询.前端通过haproxy或是lvs转发,当一个节点挂点后，另一个节点
可以实现无缝使用.而不会有MHA+mysql异步复制带来的可能数据丢失的问题.但是当一个节点写入，同时还要写到其他
的节点上，而其他的节点上还需要进行只读查询，可能影响对来自写节点提交确认的响应,不过我们可以通过使用SSD之类的方案
来减少响应的时间.

Mysql cluster的基本实现原理和MG也很类似，但是只支持ndb,而不像MG一样只支持innodb,考虑到ndb太多的缺
陷，所以很少去讨论了.

oracle狂热分子

MySQL Galera集群和ORACLE RAC的实现原理比较