搜索_华为云

GPU节点驱动版本 - 云容器引擎 CCE

GPU节点驱动版本选择GPU节点驱动版本 CCE推荐的GPU驱动版本列表手动更新GPU节点驱动版本通过节点池升级节点的GPU驱动版本父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
节点交换区检查异常处理 - 云容器引擎 CCE

节点交换区检查异常处理检查项内容检查集群CCE节点的上是否开启了交换区。解决方案 CCE节点默认关闭swap交换区，请您确认手动开启交换区的原因，并确定关闭影响；若确定无影响后请执行swapoff -a命令关闭交换区之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
业务优先级保障调度 - 云容器引擎 CCE

业务优先级保障调度优先级调度与抢占父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
AI任务性能增强调度 - 云容器引擎 CCE

AI任务性能增强调度公平调度（DRF）组调度（Gang）父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
VPC网络模型 - 云容器引擎 CCE
VPC网络模型 - 云容器引擎 CCE

VPC网络模型 VPC网络模型说明扩展集群容器网段父主题：容器网络

 帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络
Master节点时区检查 - 云容器引擎 CCE

Master节点时区检查检查项内容检查到您集群中Master节点实际时区与集群时区不一致，滚动升级后Master节点上的时区会变为集群时区。如果您集群中存在Cronjob，则可能会导致Cronjob在升级后触发一次非预期的执行。解决方案请在升级前关闭Cronjob后再次

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件检查项内容检查集群的历史升级记录，要求您的集群原始版本满足升级到目标集群版本的条件。解决方案该问题一般由于您的集群从比较老的版本升级而来，升级风险较大，建议您优先考虑集群迁移若您仍然想要升级该集群，请您提交工单，联系技术支持人员进行评估。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理检查项内容检查当前集群升级重启kubelet时，节点上运行的GPU/NPU业务容器是否可能发生重建，造成业务影响。解决方案请确保在业务影响可控的前提下（如业务低峰期）进行集群升级，以消减业务容器重建带来的影响；如需帮助，请您提交工单联系运维人员获取支持。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查集群是否满足滚动升级条件 - 云容器引擎 CCE

检查集群是否满足滚动升级条件检查项内容检查到您的集群暂时不满足滚动升级条件。解决方案该检查失败一般由于资源租户的资源配额不足引起，无法支持滚动升级；请联系运维人员扩充资源之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
ELB IPv4私网地址检查异常处理 - 云容器引擎 CCE

elbs and try again 方法二：登录CCE控制台，前往“服务”页面查看服务，单击ELB名称，跳转到ELB界面。确认ELB实例是否包含IPv4私网IP。为无IPv4私网IP地址的ELB绑定一个私网IP。登录CCE控制台，单击目标ELB名称。在基本信息页面，单击“IPv4私有IP”旁的“绑定”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
为什么kubectl top命令查看节点内存使用超过100%？ - 云容器引擎 CCE

kubectl get --raw /apis/metrics.k8s.io/v1beta1/nodes/ 回显如下： { "kind": "NodeMetricsList", "apiVersion": "metrics.k8s.io/v1beta1", "metadata": {}

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 节点运行
Prometheus Server视图 - 云容器引擎 CCE

Prometheus Server视图 Prometheus本地数据存储模式可以收集有关主机和应用程序的指标数据并存储在集群中，监控数据可以选择上报并存储到AOM或三方监控平台。Prometheus Server视图展示了Prometheus提供的一些内置指标，可用于监控和度量系统的性能和状态。

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
节点系统参数优化 - 云容器引擎 CCE

节点系统参数优化可优化的节点系统参数列表修改节点日志缓存内存占用量上限RuntimeMaxUse 修改最大文件句柄数修改节点内核参数修改节点进程 ID数量上限kernel.pid_max 父主题：节点运维

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
Ubuntu内核与GPU驱动兼容性提醒 - 云容器引擎 CCE

Ubuntu内核与GPU驱动兼容性提醒检查项内容检查到集群中同时使用GPU插件和Ubuntu节点，提醒客户存在可能的兼容性问题。当Ubuntu内核版本在5.15.0-113-generic上时，GPU插件必须使用535.161.08及以上的驱动版本。解决方案您在升级后新创

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
集群状态检查 - 云容器引擎 CCE

集群状态检查检查项内容集群升级后，需要检查集群状态是否为“运行中”状态。检查步骤系统会自动为您检查集群状态是否正常，您可以根据诊断结果前往集群列表页面进行确认。解决方案当集群状态异常时，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
K8s废弃资源检查异常处理 - 云容器引擎 CCE

failed in cluster upgrade: this cluster has deprecated service list: map[***] with deprecated annotation list [tolerate-unready-endpoints] 检查日志信息

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
用户节点组件健康检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理检查项内容检查用户节点的容器运行时组件和网络组件等是否健康。解决方案问题场景一：CNI Agent is not active 如果您的集群版本在1.17.17以下，或者1.17.17以上且是隧道网络，请登录该节点，执行systemctl status

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
仪表盘 - 云容器引擎 CCE
仪表盘 - 云容器引擎 CCE

仪表盘使用仪表盘集群视图 APIServer视图 Pod视图主机视图 Node视图节点池视图 GPU视图 XGPU视图 CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图父主题：监控中心

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心
成本计算模型 - 云容器引擎 CCE

成本计算模型工作负载成本计算原理工作负载成本是由Pod成本聚合而成。 Pod成本：使用监控指标和实际账单作为输入，通过CPU、内存使用量占整体节点资源比例计算出来的成本，结合Pod关联PVC存储的成本。计算过程中，Pod的使用量为当前采样时刻下申请量（Request）和实际使用量（Real

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生成本治理 > 成本洞察
控制节点组件健康检查异常处理 - 云容器引擎 CCE

控制节点组件健康检查异常处理检查项内容检查集群中的Kubernetes组件、容器运行时组件、网络组件等组件，要求在升级前以上组件运行正常。解决方案请您优先重试升级前检查；若重试检查仍失败时，请您提交工单，联系技术支持人员进行处理。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查

总条数： 1443

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU节点驱动版本 - 云容器引擎 CCE

节点交换区检查异常处理 - 云容器引擎 CCE

业务优先级保障调度 - 云容器引擎 CCE

AI任务性能增强调度 - 云容器引擎 CCE

VPC网络模型 - 云容器引擎 CCE

Master节点时区检查 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

检查集群是否满足滚动升级条件 - 云容器引擎 CCE

ELB IPv4私网地址检查异常处理 - 云容器引擎 CCE

为什么kubectl top命令查看节点内存使用超过100%？ - 云容器引擎 CCE

Prometheus Server视图 - 云容器引擎 CCE

节点系统参数优化 - 云容器引擎 CCE

Ubuntu内核与GPU驱动兼容性提醒 - 云容器引擎 CCE

集群状态检查 - 云容器引擎 CCE

K8s废弃资源检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理 - 云容器引擎 CCE

仪表盘 - 云容器引擎 CCE

成本计算模型 - 云容器引擎 CCE

控制节点组件健康检查异常处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线