搜索_华为云

节点Python命令检查异常处理 - 云容器引擎 CCE

节点Python命令检查异常处理检查项内容检查Node节点中Python命令是否可用。检查方式 /usr/bin/python --version echo $? 如果回显值不为0证明检查失败。解决方案可优先重置节点或手动安装Python之后再进行升级。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点配置文件检查异常处理 - 云容器引擎 CCE

节点配置文件检查异常处理检查项内容检查节点上关键组件的配置文件是否存在。当前检查文件列表如下：文件名文件内容备注 /opt/cloud/cce/kubernetes/kubelet/kubelet kubelet命令行启动参数 - /opt/cloud/cce/kub

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点交换区检查异常处理 - 云容器引擎 CCE

节点交换区检查异常处理检查项内容检查集群CCE节点的上是否开启了交换区。解决方案 CCE节点默认关闭swap交换区，请您确认手动开启交换区的原因，并确定关闭影响；若确定无影响后请执行swapoff -a命令关闭交换区之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

03 535.54.03 470.141.03 535.54.03 470.141.03 470.141.03 470.141.03 相关链接 Nvidia官方驱动下载入口主流Tesla系列各驱动版本配套说明父主题： GPU节点驱动版本

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
通过StorageClass动态创建SFS Turbo子目录 - 云容器引擎 CCE

io/share-export-location：挂载目录配置。由SFS Turbo共享路径和子目录组成，共享路径可至SFS Turbo服务页面查询，子路径由用户自定义，后续指定该StorageClass创建的PVC均位于该子目录下。 everest.io/share-volume-type：选填字段。填写SFS

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 极速文件存储（SFS Turbo）
检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件检查项内容检查集群的历史升级记录，要求您的集群原始版本满足升级到目标集群版本的条件。解决方案该问题一般由于您的集群从比较老的版本升级而来，升级风险较大，建议您优先考虑集群迁移若您仍然想要升级该集群，请您提交工单，联系技术支持人员进行评估。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理检查项内容检查当前集群升级重启kubelet时，节点上运行的GPU/NPU业务容器是否可能发生重建，造成业务影响。解决方案请确保在业务影响可控的前提下（如业务低峰期）进行集群升级，以消减业务容器重建带来的影响；如需帮助，请您提交工单联系运维人员获取支持。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查集群是否满足滚动升级条件 - 云容器引擎 CCE

检查集群是否满足滚动升级条件检查项内容检查到您的集群暂时不满足滚动升级条件。解决方案该检查失败一般由于资源租户的资源配额不足引起，无法支持滚动升级；请联系运维人员扩充资源之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
误卸载存储池的磁盘后如何恢复 - 云容器引擎 CCE

即可。本文提供的指导仅能恢复误卸载磁盘后存储池页面显示“不可用”状态，修复后可重新导入持久卷或临时卷，但无法恢复原有数据。问题现象当用户错误卸载存储池的磁盘时，会导致该节点存储池状态不可用。问题定位使用kubectl命令查看nodelocalvolumes资源： kubectl

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Master节点时区检查 - 云容器引擎 CCE

Master节点时区检查检查项内容检查到您集群中Master节点实际时区与集群时区不一致，滚动升级后Master节点上的时区会变为集群时区。如果您集群中存在Cronjob，则可能会导致Cronjob在升级后触发一次非预期的执行。解决方案请在升级前关闭Cronjob后再次

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Prometheus Server视图 - 云容器引擎 CCE

存储在WAL中的样本的最高时间戳与远程写入成功的最高时间戳的比率远程写流量字节/秒远程写入的速率当前队列数个当前用于并行发送到远程存储的分片数最大队列数个可用于并行发送到远程存储的分片数的最大值最小队列数个可用于并行发送到远程存储的分片数的最小值期望队列数

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
K8s废弃资源检查异常处理 - 云容器引擎 CCE

K8s废弃资源检查异常处理检查项内容检查集群是否存在对应版本已经废弃的资源。解决方案问题场景一： 1.25及以上集群中的service存在废弃的annotation：tolerate-unready-endpoints 报错日志信息如下： some check failed

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点CPU使用率检查异常处理 - 云容器引擎 CCE

节点CPU使用率检查异常处理检查项内容检查节点CPU使用量是否超过90%。解决方案请在业务低峰时进行集群升级。请检查该节点的Pod部署数量是否过多，适当驱逐该节点上Pod到其他空闲节点。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理检查项内容检查当前集群内使用containerd的节点在升级containerd组件时，节点上运行的业务容器是否可能发生重启，造成业务影响。解决方案检测到您的节点上的containerd服务存在重启风险；请确保在业务影响可控

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点运行时检查异常处理 - 云容器引擎 CCE

erd。如果您仍想在1.27以上集群中创建并使用docker节点，可跳过该告警，但推荐您尽快切换至containerd，它提供了更出色的用户体验和更强大的功能。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
控制节点组件健康检查异常处理 - 云容器引擎 CCE

控制节点组件健康检查异常处理检查项内容检查集群中的Kubernetes组件、容器运行时组件、网络组件等组件，要求在升级前以上组件运行正常。解决方案请您优先重试升级前检查；若重试检查仍失败时，请您提交工单，联系技术支持人员进行处理。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Ubuntu内核与GPU驱动兼容性提醒 - 云容器引擎 CCE

Ubuntu内核与GPU驱动兼容性提醒检查项内容检查到集群中同时使用GPU插件和Ubuntu节点，提醒客户存在可能的兼容性问题。当Ubuntu内核版本在5.15.0-113-generic上时，GPU插件必须使用535.161.08及以上的驱动版本。解决方案您在升级后新创

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
cce-hpa-controller插件限制检查异常处理 - 云容器引擎 CCE

cce-hpa-controller插件限制检查异常处理检查项内容检查cce-controller-hpa插件的目标版本是否存在兼容性限制。解决方案检测到目标cce-controller-hpa插件版本存在兼容性限制，需要集群安装能提供metrics api的插件，例如metrics-server；

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Master节点规格检查异常处理 - 云容器引擎 CCE

Master节点规格检查异常处理检查项内容检查本次升级集群的Master节点规格与实际的Master节点规格是否一致。解决方案该问题一般因为您进行过Master节点改造，此次升级可能会将您的Master节点重置为标准版本; 如您无法确认影响，请您提交工单联系运维人员支撑。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查

总条数： 1357

上一页
1
...
58
59
60
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

节点Python命令检查异常处理 - 云容器引擎 CCE

节点配置文件检查异常处理 - 云容器引擎 CCE

节点交换区检查异常处理 - 云容器引擎 CCE

CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

通过StorageClass动态创建SFS Turbo子目录 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

检查集群是否满足滚动升级条件 - 云容器引擎 CCE

误卸载存储池的磁盘后如何恢复 - 云容器引擎 CCE

Master节点时区检查 - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

K8s废弃资源检查异常处理 - 云容器引擎 CCE

节点CPU使用率检查异常处理 - 云容器引擎 CCE

Containerd Pod重启风险检查异常处理 - 云容器引擎 CCE

节点运行时检查异常处理 - 云容器引擎 CCE

控制节点组件健康检查异常处理 - 云容器引擎 CCE

Ubuntu内核与GPU驱动兼容性提醒 - 云容器引擎 CCE

cce-hpa-controller插件限制检查异常处理 - 云容器引擎 CCE

Master节点规格检查异常处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线