我们公司在阿里云上有一个Kubernetes集群,版本为v1.14.0。我发现处于“未就绪”状态的工作程序节点每天都会在22:00从集群中删除。起初我以为是因为我们在集群中部署了cluster-autoscaler,所以我检查了它的配置,但是没有发现任何配置会自动删除集群中的节点。下面列出了我们的cluster-autoscaler的信息。
Images:registry.cn-hangzhou.aliyuncs.com/acs/autoscaler:v1.3.1-be4edda
command:
- command:
- ./cluster-autoscaler
- --v=5
- --stderrthreshold=info
- --cloud-provider=alicloud
- --scan-interval=10s
- --scale-down-delay-after-add=10m
- --scale-down-delay-after-failure=1m
- --scale-down-unready-time=1m
- --ok-total-unready-count=1000
- --max-empty-bulk-delete=50
- --expander=least-waste
- --leader-elect=false
- --scale-down-unneeded-time=10m
- --scale-down-utilization-threshold=0.05
- --scale-down-gpu-utilization-threshold=0.3
- --skip-nodes-with-local-storage=false
- --nodes=0:100:private_information
任何帮助,将不胜感激。 最佳答案
问题解决了。有人将crontab任务设置为清除NotReady状态节点。
关于kubernetes - 为什么我的kubernetes每天在22:00删除处于NotReady状态的工作节点?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/64040096/