我们公司在阿里云上有一个Kubernetes集群,版本为v1.14.0。我发现处于“未就绪”状态的工作程序节点每天都会在22:00从集群中删除。起初我以为是因为我们在集群中部署了cluster-autoscaler,所以我检查了它的配置,但是没有发现任何配置会自动删除集群中的节点。下面列出了我们的cluster-autoscaler的信息。

Images:registry.cn-hangzhou.aliyuncs.com/acs/autoscaler:v1.3.1-be4edda
command:
      - command:
        - ./cluster-autoscaler
        - --v=5
        - --stderrthreshold=info
        - --cloud-provider=alicloud
        - --scan-interval=10s
        - --scale-down-delay-after-add=10m
        - --scale-down-delay-after-failure=1m
        - --scale-down-unready-time=1m
        - --ok-total-unready-count=1000
        - --max-empty-bulk-delete=50
        - --expander=least-waste
        - --leader-elect=false
        - --scale-down-unneeded-time=10m
        - --scale-down-utilization-threshold=0.05
        - --scale-down-gpu-utilization-threshold=0.3
        - --skip-nodes-with-local-storage=false
        - --nodes=0:100:private_information
任何帮助,将不胜感激。

最佳答案

问题解决了。有人将crontab任务设置为清除NotReady状态节点。

关于kubernetes - 为什么我的kubernetes每天在22:00删除处于NotReady状态的工作节点?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/64040096/

10-11 07:13