我有一个启用了RBAC且版本为1.14且部署了Terraform的原始EKS群集,但未在群集中安装任何软件。我刚刚执行了linkerd install | kubecetl apply -f -

完成之后,我等待了大约4分钟才能使一切稳定下来。运行kubectl get pods -n linkerd向我显示以下内容:

linkerd-destination-8466bdc8cc-5mt5f      2/2     Running   0          4m20s
linkerd-grafana-7b9b6b9bbf-k5vc2          1/2     Running   0          4m19s
linkerd-identity-6f78cd5596-rhw72         2/2     Running   0          4m21s
linkerd-prometheus-64df8d5b5c-8fz2l       2/2     Running   0          4m19s
linkerd-proxy-injector-6775949867-m7vdn   1/2     Running   0          4m19s
linkerd-sp-validator-698479bcc8-xsxnk     1/2     Running   0          4m19s
linkerd-tap-64b854cdb5-45c2h              2/2     Running   0          4m18s
linkerd-web-bdff9b64d-kcfss               2/2     Running   0          4m20s

由于某些原因linkerd-proxy-injectorlinkerd-proxy-injectorlinkerd-controllerlinkerd-grafana没有完全启动

关于我应该检查什么的任何想法? linkerd-check命令正在挂起。
linkerd-controller的日志显示:
linkerd-controller-68d7f67bc4-kmwfw linkerd-proxy ERR! [   335.058670s] admin={bg=identity} linkerd2_proxy::app::identity Failed to certify identity: grpc-status: Unknown, grpc-message: "the request could not be dispatched in a timely fashion"


linkerd-proxy ERR! [   350.060965s] admin={bg=identity} linkerd2_proxy::app::identity Failed to certify identity: grpc-status: Unknown, grpc-message: "the request could not be dispatched in a timely fashion"
time="2019-10-18T21:57:49Z" level=info msg="starting admin server on :9996"

删除 pods 并重新启动部署会导致不同的组件准备就绪,但是整个控制平面永远不会准备就绪。

最佳答案

Linkerd社区成员回答:

您安装了哪个VPC CNI版本?
我问是因为:
-https://github.com/aws/amazon-vpc-cni-k8s/issues/641
-https://github.com/mogren/amazon-vpc-cni-k8s/commit/7b2f7024f19d041396f9c05996b70d057f96da11

经过测试,这是解决方案:

果然,将AWS VPC CNI降级到v1.5.3修复了集群中的所有问题

不知道为什么,但是确实如此。
看来准入 Controller 无法与v1.5.4一起使用

因此,解决方案是使用AWS VPC CNI v1.5.3,直到确定了AWS VPC CNIN v1.5.4的根本原因。

08-18 11:35