搜索_华为云

GPU插件检查异常处理 - 云容器引擎 CCE

配置当前GPU驱动后，测试创建节点是否正常使用。您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。登录CCE控制台，前往“插件中心”处查看CCE AI套件（NVIDIA GPU）插件。单击该插件的“升级”按钮，查看插件目标版本及驱动版本。在测试环境验证安装升级

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
装箱调度（Binpack） - 云容器引擎 CCE

ck策略得分时，会考虑Pod请求的各种资源，如：CPU、Memory和GPU等扩展资源，并根据各种资源所配置的权重做平均。 Binpack算法原理 Binpack在对一个节点打分时，会根据Binpack插件自身权重和各资源设置的权重值综合打分。首先，对Pod请求资源中的每类资源依

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
VPC的子网无法删除，怎么办？ - 云容器引擎 CCE

VPC的子网无法删除，怎么办？ VPC的子网无法删除可能是因为您在CCE的集群中使用了该VPC的子网，因此需要在CCE界面删除相应的集群后，再删除VPC的子网。删除集群会将集群内的节点以及运行的工作负载和服务都销毁，请谨慎操作。不建议在ECS界面删除CCE集群中的节点。父主题：网络异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
业务检查 - 云容器引擎 CCE
业务检查 - 云容器引擎 CCE

业务检查检查项内容集群升级完毕，由用户验证当前集群正在运行的业务是否正常。检查步骤业务不同，验证的方式也有所不同，建议您在升级前确认适合您业务的验证方式，并在升级前后均执行一遍。常见的业务确认方式有：业务界面可用监控平台无异常告警与事件关键应用进程无错误日志 API拨测正常等

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
Helm V2 升级Helm V3 公告 - 云容器引擎 CCE

Helm V2 升级Helm V3 公告发布时间：2022/08/30 因控制台“模板管理”功能所依赖的开源软件Helm已从 V2 演进至 V3 版本，即日起平台会自动将集群中 Helm V2 格式实例转换为 Helm V3 格式。部分 Helm V2 功能在 Helm V3

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品变更公告
通过动态存储卷创建SFS Turbo子目录（推荐） - 云容器引擎 CCE

存储容量的浪费。为了更加经济合理地利用存储容量，CCE支持在创建PVC时动态创建SFS Turbo子目录，实现不同工作负载共享使用SFS Turbo。前提条件您已经创建好一个集群，并且在该集群中安装2.3.23及以上版本的CCE容器存储（Everest）。如果您需要通过命令

 帮助中心 > 云容器引擎 CCE > 用户指南 > 存储 > 极速文件存储（SFS Turbo）
工作负载状态正常但未正常工作 - 云容器引擎 CCE

842/pods/mypod 执行以下命令，将输出结果的pod.yaml文件与您创建Pod使用的文件进行对比。 kubectl get pods/$mypod yaml > mypod.yaml $mypod为异常Pod的名称，您可以通过kubectl get pods命令查看。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
通用文件存储（SFS 3.0）在OS中的挂载点修改属组及权限报错 - 云容器引擎 CCE

通用文件存储（SFS 3.0）在OS中的挂载点修改属组及权限报错现象描述将通用文件存储（SFS 3.0）挂载到OS中某个目录后，该目录成为通用文件存储（SFS 3.0）的挂载点，使用chown和chmod命令尝试修改挂载点的属组或权限，会遇到以下报错： chown: changing

帮助中心 > 云容器引擎 CCE > 常见问题 > 存储管理
Kubelet视图 - 云容器引擎 CCE
Kubelet视图 - 云容器引擎 CCE

Kubelet每秒执行的操作失败的次数操作时延秒 Kubelet的不同操作的操作时延 Pod启动速率次/秒 Kubelet每秒执行了pod start的次数 Pod启动时延（99分位）秒 Kubelet执行pod start操作中99%的操作的时延分布情况存储操作速率次/秒 Kubelet每秒执行的存储相关操作的次数

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
集群视图 - 云容器引擎 CCE
集群视图 - 云容器引擎 CCE

内存Limit水位百分比集群整体内存Limits占集群内存容量的百分比。 Pod数个集群中处在不同运行状态下的Pod个数（状态包含：Failed、Pending、Running、Succeeded、Unknown等）。容器数个集群中处在不同运行状态下的容器个数（状态包含：Containers

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
为Nginx Ingress配置HTTPS协议的后端服务 - 云容器引擎 CCE

1.23及以上版本集群： apiVersion: networking.k8s.io/v1 kind: Ingress metadata: name: ingress-test namespace: default annotations: nginx.ingress

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > Nginx Ingress管理 > Nginx Ingress高级配置示例
如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

操作步骤如下：登录CCE控制台，单击集群名称进入集群。在左侧列表中选择“节点管理”，勾选GPU/NPU节点，并单击“标签与污点管理”。单击“新增批量操作”，为GPU/NPU节点添加污点。选择“污点(Taints)”，并填写键值与污点效果。示例中，为GPU/NPU节点添加accelera

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
节点内存检查异常处理 - 云容器引擎 CCE

节点内存检查异常处理检查项内容检查节点内存使用量是否超过90%。解决方案请在业务低峰时进行集群升级。请检查该节点的Pod部署数量是否过多，适当驱逐该节点上Pod到其他空闲节点。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
如何修复出现故障的容器网卡？ - 云容器引擎 CCE

执行如下命令，删除故障容器的Pod。 kubectl delete pod {podName} -n {podNamespace} 其中： {podName}：替换为实际故障容器所属pod名称。 {podNamespace}：替换为实际Pod所在的namespace名称。删除故障容器的Pod之后系统

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
移除节点 - 云容器引擎 CCE
移除节点 - 云容器引擎 CCE

点执行清理脚本完成CCE组件清理，具体步骤参见重装操作系统失败如何处理。移除节点会导致与节点关联的本地持久卷类型的PVC/PV数据丢失，无法恢复，且PVC/PV无法再正常使用。移除节点时使用了本地持久存储卷的Pod会从移除的节点上驱逐，并重新创建Pod，Pod会一直处于pend

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
扩缩容节点池 - 云容器引擎 CCE

扩缩容节点池您可指定节点池中的某个规格进行扩缩容。默认节点池不支持扩缩容，请通过创建节点添加。登录CCE控制台。单击集群名称进入集群，在左侧选择“节点管理”，在右侧选择“节点池”页签。单击节点池名称后的“扩缩容”。在弹出的“节点池扩缩容”窗口中，设置扩缩容参数。扩缩容：选择“扩容节点”或“缩容节点”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池
纳管节点至节点池 - 云容器引擎 CCE

需计费节点池只支持纳管按需计费的节点。待纳管节点需与当前节点池相同的云服务器组。待纳管节点必须状态为“运行中”，且不携带 CCE 专属节点标签CCE-Dynamic-Provisioning-Node。待纳管节点的系统组件使用独立磁盘存储时需挂载数据盘，可使用本地盘（磁盘增

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点池 > 管理节点池
为ELB Ingress配置灰度发布 - 云容器引擎 CCE

ess Ingress的灰度发布功能依赖ELB能力，使用该功能前请提交工单申请开通ELB灰度发布能力。前提条件已创建一个CCE Standard或CCE Turbo集群，且集群版本满足以下要求： v1.23集群：v1.23.14-r0 及以上版本 v1.25集群：v1.25.9-r0

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > 路由（Ingress） > ELB Ingress管理 > ELB Ingress高级配置示例
如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

Guaranteed BestEffort类型的Pod：系统用完了全部内存时，该类型Pod会最先被终止。 Burstable类型的Pod：系统用完了全部内存，且没有BestEffort容器可以终止时，该类型Pod会被终止。 Guaranteed类型的Pod：系统用完了全部内存、且没有Burs

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
工作负载异常：已停止 - 云容器引擎 CCE

问题现象工作负载的状态为“已停止”。问题原因：工作负载的yaml的中metadata.enable字段为false，导致工作负载被停止，Pod被删除导致工作负载处于已停止状态，如下图所示：解决方案将enable字段删除或者将false修改为true。父主题：工作负载异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查

总条数： 1449

上一页
1
...
66
67
68
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU插件检查异常处理 - 云容器引擎 CCE

装箱调度（Binpack） - 云容器引擎 CCE

VPC的子网无法删除，怎么办？ - 云容器引擎 CCE

业务检查 - 云容器引擎 CCE

Helm V2 升级Helm V3 公告 - 云容器引擎 CCE

通过动态存储卷创建SFS Turbo子目录（推荐） - 云容器引擎 CCE

工作负载状态正常但未正常工作 - 云容器引擎 CCE

通用文件存储（SFS 3.0）在OS中的挂载点修改属组及权限报错 - 云容器引擎 CCE

Kubelet视图 - 云容器引擎 CCE

集群视图 - 云容器引擎 CCE

为Nginx Ingress配置HTTPS协议的后端服务 - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

节点内存检查异常处理 - 云容器引擎 CCE

如何修复出现故障的容器网卡？ - 云容器引擎 CCE

移除节点 - 云容器引擎 CCE

扩缩容节点池 - 云容器引擎 CCE

纳管节点至节点池 - 云容器引擎 CCE

为ELB Ingress配置灰度发布 - 云容器引擎 CCE

如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

工作负载异常：已停止 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线