搜索_华为云

K8s节点污点检查异常处理 - 云容器引擎 CCE

K8s节点污点检查异常处理检查项内容检查节点上是否存在集群升级需要使用到的污点。表1 检查污点列表污点名称污点影响 node.kubernetes.io/upgrade NoSchedule 解决方案问题场景一：该节点为集群升级过程中跳过的节点。配置Kubectl命

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
为IPv6双栈网卡的Pod配置共享带宽 - 云容器引擎 CCE

不支持HostNetwork的Pod。支持所有类型的工作负载，特别地，为Deployment，Statefulset等有副本数属性的工作负载配置IPv6共享带宽时，需确保副本数以及升级过程中最大的Pod数小于共享带宽当前剩余可加入的IPv6网卡数。配置了共享带宽的IPv6双栈Pod：Pod创建时，

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 容器网络 > 云原生网络2.0模型
工作负载异常：已停止 - 云容器引擎 CCE

问题现象工作负载的状态为“已停止”。问题原因：工作负载的yaml的中metadata.enable字段为false，导致工作负载被停止，Pod被删除导致工作负载处于已停止状态，如下图所示：解决方案将enable字段删除或者将false修改为true。父主题：工作负载异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

Guaranteed BestEffort类型的Pod：系统用完了全部内存时，该类型Pod会最先被终止。 Burstable类型的Pod：系统用完了全部内存，且没有BestEffort容器可以终止时，该类型Pod会被终止。 Guaranteed类型的Pod：系统用完了全部内存、且没有Burs

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
工作负载异常：OOM问题 - 云容器引擎 CCE

Memory）事件，导致容器异常退出。关于OOM事件，可以参考为容器和Pod分配内存资源。解决方案登录CCE控制台。单击集群名称进入集群，在左侧选择“工作负载”。单击工作负载操作列的“监控”，即可查看Pod的CPU、内存、网络I/O等监控大盘。通过Pod内存监控查看内存增长曲线，确定异常出现时间。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
实施步骤 - 云容器引擎 CCE
实施步骤 - 云容器引擎 CCE

实施步骤搭建Jenkins和Gitlab环境配置集群环境配置Gitlab项目持续集成及持续部署父主题：使用Jenkins和Gitlab实现多集群隔离的DevOps流程

 帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps > 使用Jenkins和Gitlab实现多集群隔离的DevOps流程
集群状态检查 - 云容器引擎 CCE

集群状态检查检查项内容集群升级后，需要检查集群状态是否为“运行中”状态。检查步骤系统会自动为您检查集群状态是否正常，您可以根据诊断结果前往集群列表页面进行确认。解决方案当集群状态异常时，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
业务优先级保障调度 - 云容器引擎 CCE

业务优先级保障调度优先级调度与抢占父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
AI任务性能增强调度 - 云容器引擎 CCE

AI任务性能增强调度公平调度（DRF）组调度（Gang）父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
节点挂载点检查异常处理 - 云容器引擎 CCE

检查节点上是否存在不可访问的挂载点。解决方案问题场景：节点上存在不可访问的挂载点节点存在不可访问的挂载点，通常是由于该节点或节点上的Pod使用了网络存储nfs（常见的nfs类型有obsfs、sfs等），且节点与远端nfs服务器断连，导致挂载点失效，所有访问该挂载点的进程均会出现D状态卡死。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件检查项内容检查集群的历史升级记录，要求您的集群原始版本满足升级到目标集群版本的条件。解决方案该问题一般由于您的集群从比较老的版本升级而来，升级风险较大，建议您优先考虑集群迁移若您仍然想要升级该集群，请您提交工单，联系技术支持人员进行评估。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理检查项内容检查当前集群升级重启kubelet时，节点上运行的GPU/NPU业务容器是否可能发生重建，造成业务影响。解决方案请确保在业务影响可控的前提下（如业务低峰期）进行集群升级，以消减业务容器重建带来的影响；如需帮助，请您提交工单联系运维人员获取支持。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
检查集群是否满足滚动升级条件 - 云容器引擎 CCE

检查集群是否满足滚动升级条件检查项内容检查到您的集群暂时不满足滚动升级条件。解决方案该检查失败一般由于资源租户的资源配额不足引起，无法支持滚动升级；请联系运维人员扩充资源之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点池多规格计费说明 - 云容器引擎 CCE

节点池多规格计费说明若节点池中选择了多个规格时，控制台中显示的是节点池默认规格的价格，在节点池创建或扩缩容过程中，将以实际创建的规格进行计费。计费样例示例，某一按需节点池中添加了两个规格类型，其中默认规格A价格（包含云硬盘价格）为0.5735元/小时，另一规格B价格为1.0015元/小时。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池
公平调度（DRF） - 云容器引擎 CCE

即每个用户的主资源满足 max-min fairness 要求。每个Job资源的Share值计算如下： Share = Total Request / Cluster Resources 当Job具有多个资源时，将Share值最大的资源作为主资源，在进行优先级调度时，仅根据主资源的Share值进行优先级调度。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > AI任务性能增强调度
如何确认已创建的集群是否为多控制节点模式？ - 云容器引擎 CCE

如何确认已创建的集群是否为多控制节点模式？登录CCE控制台，进入集群，在集群详情页面右侧查看控制节点数量： 3个节点即为多控制节点模式。 1个节点即为单控制节点模式。集群一旦创建，便无法更改控制节点数，需要重新创建集群才能调整。父主题：集群运行

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
节点池弹性伸缩优先级说明 - 云容器引擎 CCE

通过预判算法，在所有节点池中选择能满足Pending状态的Pod正常调度的规格。考虑因素包括节点资源是否满足Pod的Request值，以及nodeSelector、nodeAffinity和taints等是否满足Pod正常调度的条件。另外，部分节点池规格由于资源不足等扩容失败

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 节点弹性伸缩
用户节点组件健康检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理检查项内容检查用户节点的容器运行时组件和网络组件等是否健康。解决方案问题场景一：CNI Agent is not active 如果您的集群版本在1.17.17以下，或者1.17.17以上且是隧道网络，请登录该节点，执行systemctl status

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点状态检查 - 云容器引擎 CCE

节点状态检查检查项内容集群升级后，需要检查节点状态是否为“运行中”状态。检查步骤系统会自动为您检查集群内节点的状态，您可以根据诊断结果前往节点列表页面进行确认。解决方案集群节点异常时，建议您通过重置节点来解决，若无法解决，请联系技术支持人员。父主题：升级后验证

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
健康检查探针（Liveness、Readiness）偶现检查失败? - 云容器引擎 CCE

健康检查探针（Liveness、Readiness）偶现检查失败? 健康检查探针偶现检测失败，是由于容器内的业务故障所导致，您需要优先定位自身业务问题。常见情况有：业务处理时间长，导致返回超时。 tomcat建链和等待耗费时间太长（连接数、线程数等），导致返回超时。容器所在

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 容器设置

总条数： 1448

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

K8s节点污点检查异常处理 - 云容器引擎 CCE

为IPv6双栈网卡的Pod配置共享带宽 - 云容器引擎 CCE

工作负载异常：已停止 - 云容器引擎 CCE

如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

工作负载异常：OOM问题 - 云容器引擎 CCE

实施步骤 - 云容器引擎 CCE

集群状态检查 - 云容器引擎 CCE

业务优先级保障调度 - 云容器引擎 CCE

AI任务性能增强调度 - 云容器引擎 CCE

节点挂载点检查异常处理 - 云容器引擎 CCE

检查历史升级记录是否满足升级条件 - 云容器引擎 CCE

GPU/NPU Pod重建风险检查异常处理 - 云容器引擎 CCE

检查集群是否满足滚动升级条件 - 云容器引擎 CCE

节点池多规格计费说明 - 云容器引擎 CCE

公平调度（DRF） - 云容器引擎 CCE

如何确认已创建的集群是否为多控制节点模式？ - 云容器引擎 CCE

节点池弹性伸缩优先级说明 - 云容器引擎 CCE

用户节点组件健康检查异常处理 - 云容器引擎 CCE

节点状态检查 - 云容器引擎 CCE

健康检查探针（Liveness、Readiness）偶现检查失败? - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线