我试着用三台机器和下面这样的主从机来实现HA。我正在使用VM进行本地测试设置,我的观察结果如下。
案例1:
m1->领导大师
m2->非领队主将,奴隶1
m3->非领队主队,奴隶2
案例1.1:当我关闭VM m1机器时,其中一个非leader变为
引导并能够访问群集,工作正常。
案例1.2:I关闭m2或m3电源(任何一个带有非主设备和从设备的虚拟机)。
我在m3或m2的网页上看到了这样一条信息:“当前没有主控”。当我试图访问m1和任何可用机器(m2或m3)中的介子时。
案例2:
m1->非引线
m2->领袖,奴隶1,
m3->非先导,从动2
案例2.1:当我关闭VM m1机器时,m2中的leader将被保持,集群将正常工作。
案例2.2:当我关闭m2(带从机的主机)电源时,群集将不可用,并在网页上显示错误消息“当前没有主机在引导”。
案例2.3:当我关闭m3电源(带从设备的非主设备)时,群集将不可用,并在网页上显示错误消息“当前没有主设备在引导”。
很抱歉只使用3台机器和冗长的问题解释来尝试HA。
问题:
同时具有主(引导/非引导)和从机的杀戮机器将始终导致群集不可用?(案例1.2,2.2,2.3)
我们能用上述三台机器实现HA吗,即在同一台机器上有三个主机和两个从机,主机和从机?
以下是配置。
大师:
m1:mesos master--ip=192.168.1.36--hostname=192.168.1.36--port=6060--quorum=2--cluster=mesosCluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work-dir=/opt/ncms/mesosWorkDir/--log-dir=/opt/ncms/mesosWorkDir/logs
m2:mesos master--ip=192.168.1.42--hostname=192.168.1.42--port=6060--quorum=2--cluster=mesosCluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work-dir=/opt/ncms/mesosWorkDir/--log-dir=/opt/ncms/mesosWorkDir/logs
m3:mesos master--ip=192.168.1.45--hostname=192.168.1.45--port=6060--quorum=2--cluster=mesosCluster--zk=zk://192.168.1.36:2181192.168.1.42:2181192.168.1.45:2181/mesos--work-dir=/opt/ncms/mesosWorkDir/--log-dir=/opt/ncms/mesosWorkDir/logs
奴隶:
m2:mesos slave--ip=192.168.1.42--hostname=192.168.1.42--executor_registration_timeout=10mins--systemd_enable_support=false--master=zk://192.168.1.42:2181192.168.1.45:2181192.168.1.36:2181/mesos--containers=mesos,docker
m3:mesos slave--ip=192.168.1.45--hostname=192.168.1.45--executor_registration_timeout=10mins--systemd_enable_support=false--master=zk://192.168.1.42:2181192.168.1.45:2181192.168.1.36:2181/mesos--containers=mesos,docker
Zookeeper配置:
计时=2000
初始限制=10
同步限制=5
数据目录=/opt/ncms/zkWorkDir
客户端端口=2181
服务器1=192.168.1.42:2888:3888
服务器3=192.168.1.36:2888:3888
服务器.5=192.168.1.45:2888:3888
设置:
主机:Windows7(64GB内存,24核)
虚拟盒:每个虚拟机(m1,m2,
m3)具有2核和2 GB RAM,RHEL 7.2
最佳答案
在您描述的场景中,活动主控形状的数量低于quorum,在您的情况下是2。这被视为异常情况,某些操作不会成功,例如,任何操作modifying the distributed registry。
关于linux - mesos主服务器和代理同时关闭时,mesos集群无法进入吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42923412/