华为云UCS-本地集群接入失败怎么办?:排查思路

时间:2024-09-11 10:21:53

排查思路

集群处于异常状态的排查思路大致可根据报错信息进行定位,如表1所示。

表1 报错信息说明

报错信息

说明

推荐排查项

“currently no agents available, please make sure the agents are correctly registered”

出现该错误的原因大概率为接入集群中的proxy-agent运行状态异常或网络异常。

  • 排查项一:proxy-agent的运行状态
  • 排查项二:集群与U CS 网络连接状态

“please check the health status of kube apiserver: ...”

出现该错误的原因大概率为集群内部kube-apiserver无法访问。

  • 排查项三:集群kube-apiserver状态

“cluster responded with non-successful status code: ...”

出现该错误的原因可能是多样的,请根据实际状态码进行排查。

例如状态码401表示用户没有访问权限,可能的原因是集群认证信息过期。

  • 排查项四:集群认证信息变化

“cluster responded with non-successful message: ...”

出现该错误的原因可能是多样的,请根据实际信息进行排查。

例如“Get "https://172.16.0.143:6443/readyz?timeout=32s\": context deadline exceeded”显示访问apiserver超时,可能是因为集群apiserver发生故障。

-

“Current cluster version is not supported in UCS service.”

出现该错误的原因是集群版本不符合要求:接入UCS服务的Kubernetes集群版本必须为1.19及以上。

-

support.huaweicloud.com/ucs_faq/ucs_faq_0035.html