华为云UCS-附着集群接入失败怎么办?:排查思路
排查思路
集群处于异常状态的排查思路大致可根据报错信息进行定位,如表1所示。
报错信息 |
说明 |
推荐排查项 |
---|---|---|
“currently no agents available, please make sure the agents are correctly registered” |
出现该错误的原因大概率为接入集群中的proxy-agent运行状态异常或网络异常。 |
|
“please check the health status of kube apiserver: ...” |
出现该错误的原因大概率为集群内部kube-apiserver无法访问。 |
|
“cluster responded with non-successful status code: ...” |
出现该错误的原因可能是多样的,请根据实际状态码进行排查。 例如状态码401表示用户没有访问权限,可能的原因是集群认证信息过期。 |
|
“cluster responded with non-successful message: ...” |
出现该错误的原因可能是多样的,请根据实际信息进行排查。 例如“Get "https://172.16.0.143:6443/readyz?timeout=32s\": context deadline exceeded”显示访问apiserver超时,可能是因为集群apiserver发生故障。 |
- |
“Current cluster version is not supported in UCS service.” |
出现该错误的原因是集群版本不符合要求:接入UCS服务的Kubernetes集群版本必须为1.19及以上。 |
- |