Shell脚本实现---Swarm集群部署实例(Swarm Cluster)
一、机器环境(均是centos7.8)
1、设置主机名
在manager节点上
# hostnamectl --static set-hostname manager-swarm
在node1节点上
# hostnamectl --static set-hostname node1-swarm
在node2节点上
# hostnamectl --static set-hostname node2-swarm
2、相互域名解析(三台机都执行)
[root@manager-swarm ~]# cat >> /etc/hosts << EOF > 192.168.10.200 manager-swarm > 192.168.10.201 node1-swarm > 192.168.10.202 node2-swarm > EOF
3、关闭三台机器上的防火墙、selinux。
如果开启防火墙,则需要在所有节点的防火墙上依次放行2377/tcp(管理端口)、7946/udp(节点间通信端口)、4789/udp(overlay 网络端口)
# systemctl stop firewalld # systemctl disable firewalld # setenforce 0 # sed -i '/^SELINUX=/c SELINUX=disabled' /etc/selinux/config
4、在manager-swarm节点上传公钥
二、部署安装
# vim swarm_cluster_install.sh
#!bin/bash #auther:sunli #mail:<1916989848@qq.com> manager=192.168.10.200 node1=192.168.10.201 node2=192.168.10.202 cat >> docker_install.sh << EOF #/bin/bash #auther:sunli #mail:<1916989848@qq.com> #下载国内docker源,并安装 curl http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -o /etc/yum.repos.d/docker-ce.repo yum -y install docker-ce [ `echo $?` -ne 0 ] && echo "Please check your epel.repo" && exit #配置阿里云镜像加速器 [ ! -d /etc/docker ] && mkdir /etc/docker cat >> /etc/docker/daemon.json <<- EOF { "registry-mirrors": ["https://pf5f57i3.mirror.aliyuncs.com"] } EOF #修改docker监听端口 #Swarm是通过监听2375端口进行通信的,所以在使用Swarm进行集群管理之前,需要设置一下2375端口的监听。所有主机节点docker开启2375,2377(swarm集群)监听,docker版本不同,配置方式不一样 sed -i '/^ExecStart/ s#.*#& -H tcp://0.0.0.0:2375 -H unix:///var/run/docker.sock#g' /usr/lib/systemd/system/docker.service #启动并设置开机自启 systemctl enable docker systemctl start docker #拉取官方swarm镜像 docker pull swarm EOF #用ansible给node节点传递脚本并执行 [ ! -x /usr/bin/ansible ] && yum -y install ansible cat >> /etc/ansible/hosts << EOF [docker] $node1 $node2 EOF ansible docker -m script -a 'creates=/root/docker_install.sh /root/docker_install.sh' sh /root/docker_install.sh #创建swarm(要保存初始化后token保存至swarm_token.log docker swarm init --advertise-addr $manager |tee swarm_token.log #添加节点到swarm集群中 swarm_token=$(sed -n '/--token/p' swarm_token.log) ssh $node1 "$swarm_token" ssh $node2 "$swarm_token" #在manager-swarm输出节点状态 docker node ls
执行最后输出:
三、日常运维中用到的Swarm相关命令
1) 初始化swarm manager并制定网卡地址 # docker swarm init --advertise-addr 182.48.115.237 2) 删除集群,强制退出需要加–force (针对manager节点). 到各个节点上执行退出集群的命令 # docker node rm swarm-node1 # docker swarm leave --force //manager节点退出集群,需要加--force 3) 查看swarm worker的连接令牌 # docker swarm join-token worker 4) 加入docker swarm集群,作为worker节点 利用上面3)执行结果中的命令放在其他节点上执行,则该节点加入到swarm集群中作为worker节点 5) 查看swarm manager的连接令牌 # docker swarm join-token manager 6) 加入docker swarm集群,作为manager节点 利用上面5)执行结果中的命令放在其他节点上执行,则该节点加入到swarm集群中作为manager管理节点,状态为reachable. 备注:如果之前的leader状态的manager管理节点挂了后(假如systemctl stop docker, 然后再systemctl start docker), 则新加入的manager节点状态由reachable变为leader, 之前的manager节点状态为unreachable. 7) 使旧令牌无效并生成新令牌 # docker swarm join-token --rotate 8) 查看集群中的节点 # docker node ls 9) 查看集群中节点信息 # docker node inspect swarm-node1 --pretty 10) 调度程序可以将任务分配给节点 # docker node update --availability active swarm-node1 11) 调度程序不向节点分配新任务,但是现有任务仍然保持运行 # docker node update --availability pause swarm-node1 12) 调度程序不会将新任务分配给节点。调度程序关闭任何现有任务并在可用节点上安排它们. 也就是线下节点,不参与任务分配. # docker node update --availability drain swarm-node1 13) 添加节点标签 # docker node update --label-add label1 --label-add bar=label2 swarm-node1 14) 删除节点标签 # docker node update --label-rm label1 swarm-node1 15) 将worker节点升级为manager节点 # docker node promote swarm-node1 16) 将manager节点降级为worker节点 # docker node demote swarm-manager-node 17) 查看服务列表 # docker service ls 18) 查看服务的具体信息 # docker service ps my-test 19) 创建一个不定义name,不定义replicas的服务. (如下的nginx是docker的nginx镜像名称,不是服务名称) # docker service create nginx 20) 创建一个指定name的服务 # docker service create --name my-nginx nginx 21) 创建一个指定name、run cmd的服务 # docker service create --name my-nginx nginx ping www.baidu.com 22) 创建一个指定name、version、run cmd的服务 # docker service create --name my-redis redis:3.0.6 # docker service create --name my-nginx nginx:1.8 /bin/bash 23) 创建一个指定name、port、replicas的服务 # docker service create --name my-nginx --replicas 3 -p 80:80 nginx 24) 为指定的服务更新一个端口 # docker service update --publish-add 80:80 my-nginx 25) 为指定的服务删除一个端口 # docker service update --publish-rm 80:80 my-nginx 26) 将redis:3.0.6更新至redis:3.0.7 # docker service update --image redis:3.0.7 redis 27) 配置运行环境,指定工作目录及环境变量 # docker service create --name my-nginx --env MYVAR=myvalue --workdir /data/www --user my_user nginx ping www.baidu.com 28) 创建一个my-nginx的服务 # docker service create --name my-nginx nginx ping www.baidu.com 29) 更新my-nginx服务的运行命令 # docker service update --args "ping www.baidu.com" my-nginx 30) 删除一个服务 # docker service rm my-nginx 31) 在每个群组节点上运行web服务 # docker service create --name tomcat --mode global --publish mode=host,target=8080,published=8080 tomcat:latest 32) 创建一个overlay网络 # docker network create --driver overlay my-network # docker network create --driver overlay --subnet 10.10.10.0/24 --gateway 10.10.10.1 haha-network 33) 创建服务并将网络添加至该服务 # docker service create --name my-test --replicas 3 --network my-network redis 34) 删除群组网络 # docker service update --network-rm my-network my-test 35) 更新群组网络 # docker service update --network-add haha-network my-test 36) 创建群组并配置cpu和内存 # docker service create --name my_nginx --reserve-cpu 2 --reserve-memory 512m --replicas 3 nginx 37) 更改所分配的cpu和内存 # docker service update --reserve-cpu 1 --reserve-memory 256m my_nginx 38) 创建服务时自定义的几个参数 指定每次更新的容器数量 --update-parallelism 指定容器更新的间隔 --update-delay 定义容器启动后监控失败的持续时间 --update-monitor 定义容器失败的百分比 --update-max-failure-ratio 定义容器启动失败之后所执行的动作 --update-failure-action 比如:创建一个服务并运行3个副本,同步延迟10秒,10%任务失败则暂停 # docker service create --name mysql_5_6_36 --replicas 3 --update-delay 10s --update-parallelism 1 --update-monitor 30s --update-failure-action pause --update-max-failure-ratio 0.1 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36 39) 回滚至之前版本 # docker service update --rollback mysql 自动回滚 如果服务部署失败,则每次回滚2个任务,监控20秒,回滚可接受失败率20% # docker service create --name redis --replicas 6 --rollback-parallelism 2 --rollback-monitor 20s --rollback-max-failure-ratio .2 redis:latest 40) 创建服务并将目录挂在至container中 # docker service create --name mysql --publish 3306:3306 --mount type=bind,src=/data/mysql,dst=/var/lib/mysql --replicas 3 -e MYSQL_ROOT_PASSWORD=123456 mysql:5.6.36 需要注意使用bind绑定宿主机目录会带来的风险 - 绑定的主机路径必须存在于每个集群节点上,否则会有问题; - 调度程序可能会在任何时候重新安排运行服务容器,如果目标节点主机变得不健康或无法访问; - 主机绑定数据不可移植,当你绑定安装时,不能保证你的应用程序开发方式与生产中的运行方式相同; 41) 添加swarm配置 # echo "this is a mysql config" | docker config create mysql - 42) 查看配置 # docker config ls 查看配置详细信息 # docker config inspect mysql 43) 删除配置 # docker config rm mysql 44) 添加配置 # docker service update --config-add mysql mysql 45) 删除配置 # docker service update --config-rm mysql mysql 46) 添加配置 # docker config create kevinpage index.html 47) 启动容器的同时添加配置(target如果报错,就使用dst或destination) # docker service create --name nginx --publish 80:80 --replicas 3 --config src=kevinpage,target=/usr/share/nginx/html/index.html nginx
遇到问题记录:
1、删除节点报错
Error response from daemon: rpc error: code = FailedPrecondition desc = node krngsansedm5pr6e6dziscs4e is not down and can't be removed
解决方法如下: -f 强制删除
# docker node rm -f node1-swarm
2、添加节点报错
Error response from daemon: This node is already part of a swarm. Use "docker swarm leave" to leave this swarm and join another one.
解决方法如下:根据提示先执行# docker swarm leave,再输入work节点令牌