搜索_华为云

节点Python命令检查异常处理 - 云容器引擎 CCE

节点Python命令检查异常处理检查项内容检查Node节点中Python命令是否可用。检查方式 /usr/bin/python --version echo $? 如果回显值不为0证明检查失败。解决方案可优先重置节点或手动安装Python之后再进行升级。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU插件关键参数检查异常处理 - 云容器引擎 CCE

GPU插件关键参数检查异常处理检查项内容检查CCE GPU插件中部分配置是否被侵入式修改，被侵入式修改的插件可能导致升级失败。解决方案使用kubectl连接集群。执行以下命令获取插件实例详情。 kubectl get ds nvidia-driver-installer

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点Sudo检查异常处理 - 云容器引擎 CCE

节点Sudo检查异常处理检查项内容检查当前节点sudo命令，sudo相关文件是否正常。解决方案问题场景一：sudo命令执行失败集群原地升级过程中依赖sudo命令正常可用，请登录节点执行如下命令，排查sudo命令可用性。 sudo echo hello 如果sudo命令不

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
升级管控检查异常处理 - 云容器引擎 CCE

升级管控检查异常处理检查项内容检查集群是否处于升级管控中。解决方案 CCE基于以下几点原因，可能会暂时限制该集群的升级功能：基于用户提供的信息，该集群被识别为核心重点保障的生产集群。正在或即将进行其他运维任务，例如Master节点3AZ改造等。集群中存在容器引擎为Do

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点内存检查异常处理 - 云容器引擎 CCE

节点内存检查异常处理检查项内容检查节点内存使用量是否超过90%。解决方案请在业务低峰时进行集群升级。请检查该节点的Pod部署数量是否过多，适当驱逐该节点上Pod到其他空闲节点。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
轮转证书文件数量检查 - 云容器引擎 CCE

轮转证书文件数量检查检查项内容检查您节点上的证书数量过多（>1000），由于升级过程中会批量处理证书文件，证书文件过多可能导致节点升级过慢，节点上Pod被驱逐等。解决方案方案一：优先建议您重置节点，详情请参考重置节点。方案二：修复节点上证书轮转异常问题。登录节点，并进入节点证书目录。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点挂载点检查异常处理 - 云容器引擎 CCE

节点挂载点检查异常处理检查项内容检查节点上是否存在不可访问的挂载点。解决方案问题场景：节点上存在不可访问的挂载点节点存在不可访问的挂载点，通常是由于该节点或节点上的Pod使用了网络存储nfs（常见的nfs类型有obsfs、sfs等），且节点与远端nfs服务器断连，导致挂

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点sock文件挂载检查异常处理 - 云容器引擎 CCE

节点sock文件挂载检查异常处理检查项内容检查节点上的Pod是否直接挂载docker/containerd.sock文件。升级过程中Docker/Containerd将会重启，宿主机sock文件发生变化，但是容器内的sock文件不会随之变化，二者不匹配，导致您的业务无法访问D

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件检查项内容检查集群的历史升级记录，要求您的集群原始版本满足升级到目标集群版本的条件。解决方案该问题一般由于您的集群从比较老的版本升级而来，升级风险较大，建议您优先考虑集群迁移若您仍然想要升级该集群，请您提交工单，联系技术支持人员进行评估。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理检查项内容检查当前集群升级重启kubelet时，节点上运行的GPU/NPU业务容器是否可能发生重建，造成业务影响。解决方案请确保在业务影响可控的前提下（如业务低峰期）进行集群升级，以消减业务容器重建带来的影响；如需帮助，请您提交工单联系运维人员获取支持。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查集群是否满足滚动升级条件 - 云容器引擎 CCE

检查集群是否满足滚动升级条件检查项内容检查到您的集群暂时不满足滚动升级条件。解决方案该检查失败一般由于资源租户的资源配额不足引起，无法支持滚动升级；请联系运维人员扩充资源之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点CPU数量检查异常处理 - 云容器引擎 CCE

节点CPU数量检查异常处理检查项内容检查您的集群Master节点的CPU核心数量，要求Master节点的核心数量大于2核。解决方案当前您的Master节点cpu数量为2，可能会导致集群升级失败；请联系技术支持人员，将该集群Master节点扩容至4核及以上。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点关键命令检查异常处理 - 云容器引擎 CCE

节点关键命令检查异常处理检查项内容检查节点升级依赖的一些关键命令是否能正常执行。解决方案问题场景一：包管理器命令执行失败检查到包管理器命令rpm或dpkg命令执行失败，请登录节点排查下列命令的可用性。 rpm -qa 如果上述命令不可用，可通过以下命令恢复： rpm --rebuilddb

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查节点镜像数量异常处理 - 云容器引擎 CCE

检查节点镜像数量异常处理检查项内容检查到您的节点上镜像数量过多（>1000个），可能导致docker启动过慢，影响docker标准输出，影响nginx等功能的正常使用。解决方案请手动删除残留的镜像，防止后续升级异常；删除镜像之后请您重新进行升级前检查父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点镜像层数量异常检查 - 云容器引擎 CCE

节点镜像层数量异常检查检查项内容检查到您的节点上镜像层数量过多（>5000层），可能导致docker/containerd启动过慢，影响docker/containerd标准输出。如果您集群中使用了nginx，可能会出现转发变慢等问题。解决方案请登录节点手动删除用不到的镜像，防止后续升级异常。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
集群网络组件的NetworkPolicy开关检查 - 云容器引擎 CCE

集群网络组件的NetworkPolicy开关检查检查项内容检查您集群网络组件的NetworkPolicy开关配置，如果您在集群Master节点上对NetworkPolicy开关进行过手动修改，那么升级过程中该配置会被刷新成默认值。解决方案根据诊断分析中的日志排查网络组件c

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Master节点时区检查 - 云容器引擎 CCE

Master节点时区检查检查项内容检查到您集群中Master节点实际时区与集群时区不一致，滚动升级后Master节点上的时区会变为集群时区。如果您集群中存在Cronjob，则可能会导致Cronjob在升级后触发一次非预期的执行。解决方案请在升级前关闭Cronjob后再次

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
健康检查探针（Liveness、Readiness）偶现检查失败? - 云容器引擎 CCE

健康检查探针（Liveness、Readiness）偶现检查失败? 健康检查探针偶现检测失败，是由于容器内的业务故障所导致，您需要优先定位自身业务问题。常见情况有：业务处理时间长，导致返回超时。 tomcat建链和等待耗费时间太长（连接数、线程数等），导致返回超时。容器所在

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 容器设置
K8s废弃资源检查异常处理 - 云容器引擎 CCE

K8s废弃资源检查异常处理检查项内容检查集群是否存在对应版本已经废弃的资源。解决方案问题场景一： 1.25及以上集群中的service存在废弃的annotation：tolerate-unready-endpoints 报错日志信息如下： some check failed

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点上CCE Agent版本检查异常处理 - 云容器引擎 CCE

节点上CCE Agent版本检查异常处理检查项内容检测当前节点的CCE包管理组件cce-agent是否为最新版本。解决方案问题场景一：错误信息为“you cce-agent no update, please restart it”。该问题是由于cce-agent没有

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查

总条数： 498

上一页
1
2
3
4
5
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

节点Python命令检查异常处理 - 云容器引擎 CCE

GPU插件关键参数检查异常处理 - 云容器引擎 CCE

节点Sudo检查异常处理 - 云容器引擎 CCE

升级管控检查异常处理 - 云容器引擎 CCE

节点内存检查异常处理 - 云容器引擎 CCE

轮转证书文件数量检查 - 云容器引擎 CCE

节点挂载点检查异常处理 - 云容器引擎 CCE

节点sock文件挂载检查异常处理 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

检查集群是否满足滚动升级条件 - 云容器引擎 CCE

节点CPU数量检查异常处理 - 云容器引擎 CCE

节点关键命令检查异常处理 - 云容器引擎 CCE

检查节点镜像数量异常处理 - 云容器引擎 CCE

节点镜像层数量异常检查 - 云容器引擎 CCE

集群网络组件的NetworkPolicy开关检查 - 云容器引擎 CCE

Master节点时区检查 - 云容器引擎 CCE

健康检查探针（Liveness、Readiness）偶现检查失败? - 云容器引擎 CCE

K8s废弃资源检查异常处理 - 云容器引擎 CCE

节点上CCE Agent版本检查异常处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线