搜索_华为云

节点命令行检查异常处理 - 云容器引擎 CCE

节点命令行检查异常处理检查项内容检查节点中是否存在升级所必须的命令。解决方案该问题一般由于节点上缺少集群升级流程中使用到的关键命令，可能会导致集群升级失败。报错信息如下： __error_code#ErrorCommandNotExist#chage command is

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
创建节点时执行安装前/后脚本 - 云容器引擎 CCE

请避免在安装后脚本中直接使用reboot指令。当前CCE会在执行完节点必备组件的安装之后，再执行安装后脚本。当安装后脚本执行完之后才会将节点状态置为可用状态。如果直接使用reboot命令，可能会导致节点在上报状态之前就被重启，从而造成节点无法在30min内到达运行中状态，触发超时回滚。因此请尽量避免使用reboot指令。

帮助中心 > 云容器引擎 CCE > 最佳实践 > 集群
检查节点镜像数量异常处理 - 云容器引擎 CCE

检查节点镜像数量异常处理检查项内容检查到您的节点上镜像数量过多（>1000个），可能导致docker启动过慢，影响docker标准输出，影响nginx等功能的正常使用。解决方案请手动删除残留的镜像，防止后续升级异常；删除镜像之后请您重新进行升级前检查父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
查询指定节点池支持配置的参数内容 - 云容器引擎 CCE

查询指定节点池支持配置的参数内容功能介绍该API用于查询指定节点池支持配置的参数内容。调用方法请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{nodepo

帮助中心 > 云容器引擎 CCE > API参考 > API > 配置管理
如何批量修改集群node节点安全组？ - 云容器引擎 CCE

通过修改左下角的单页最大显示条数，您可至多一次性添加20台服务器至安全组中。加入新的安全组后，节点仍保留原安全组。如需移除，请单击原安全组的“管理实例”按钮，并勾选其中的节点服务器进行移除。父主题：安全加固

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 安全加固
节点配置文件检查异常处理 - 云容器引擎 CCE

/etc/default/docker docker配置文件 containerd运行时或Centos-Group机器不检查解决方案建议您进行重置节点操作，参考重置节点。如果您不想重置节点，请联系技术支持人员恢复配置文件后进行升级。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
更改集群节点的默认安全组 - 云容器引擎 CCE

功创建节点。安全组需要满足的端口规则根据集群类别存在差异，详情请参见集群安全组规则配置。新安全组只对新创建或纳管的节点生效，存量节点需要手动修改节点安全组规则，即使对存量节点进行重置，也仍会使用原安全组。如需批量修改存量节点的安全组设置，请参考如何批量修改集群node节点安全组？。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
节点NetworkManager检查异常处理 - 云容器引擎 CCE

节点NetworkManager检查异常处理检查项内容检查节点上的NetworkManager状态是否正常。解决方案请登录该节点，执行systemctl is-active NetworkManager命令查询NetworkManager服务运行状态。若回显状态异常，请执行systemctl

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
cgroup统计资源异常导致kubelet驱逐Pod - 云容器引擎 CCE

cgroup统计资源异常导致kubelet驱逐Pod 故障现象 ARM架构节点上，cgroup统计资源异常导致kubelet驱逐Pod，节点无法正常使用。 kubelet一直在驱逐pod，把容器全终止之后还是认为内存不足。此时实际资源使用正常。查看/sys/fs/cgroup

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
节点交换区检查异常处理 - 云容器引擎 CCE

节点交换区检查异常处理检查项内容检查集群CCE节点的上是否开启了交换区。解决方案 CCE节点默认关闭swap交换区，请您确认手动开启交换区的原因，并确定关闭影响；若确定无影响后请执行swapoff -a命令关闭交换区之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点本地域名解析加速 - 云容器引擎 CCE

强制模式：插件Deployment实例强制调度到不同可用区的节点上，每个可用区下最多运行一个实例。如集群下节点不满足多可用区，插件实例将无法全部运行。节点故障后，插件实例存在无法迁移风险。节点亲和不配置：插件实例不指定节点亲和调度。指定节点调度：指定插件实例部署的节点。若不指定，将根据集群默认调度策略进行随机调度。

帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 容器网络插件
节点标签更新导致的Pod容器退出问题 - 云容器引擎 CCE

标签与所在节点的标签一致，避免kubelet重启后由于亲和策略检查不通过导致Pod容器退出，或者Pod重新部署后由于亲和策略不匹配节点标签导致Pod无法在原节点启动。解决方案如果您仅需要新增节点或节点池的K8S标签，建议不要删除节点或节点池上原有的K8S标签，使节点保持满足节点上已运行Pod的亲和策略。

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
节点配置一致性检查异常处理 - 云容器引擎 CCE

节点配置一致性检查异常处理检查项内容在升级集群版本至v1.19及以上版本时，将对您的节点上的Kubenertes组件的配置进行检查，检查您是否后台修改过配置文件。 /opt/cloud/cce/kubernetes/kubelet/kubelet /opt/cloud/cce

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
集群节点使用networkpolicy概率性出现panic问题 - 云容器引擎 CCE

canal-agent 回显如图：解决办法如果您希望继续使用该节点资源，建议重置所属集群中的CentOS 7.6节点，以升级节点上网络组件到最新版本，具体操作请参考重置节点。如果您希望删除该隐患节点后重新购买，具体操作请参考删除节点、购买节点。父主题：网络异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
节点CPU使用率检查异常处理 - 云容器引擎 CCE

节点CPU使用率检查异常处理检查项内容检查节点CPU使用量是否超过90%。解决方案请在业务低峰时进行集群升级。请检查该节点的Pod部署数量是否过多，适当驱逐该节点上Pod到其他空闲节点。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
用户节点组件健康检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理检查项内容检查用户节点的容器运行时组件和网络组件等是否健康。解决方案问题场景一：CNI Agent is not active 如果您的集群版本在1.17.17以下，或者1.17.17以上且是隧道网络，请登录该节点，执行systemctl status

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Master节点SSH连通性检查异常处理 - 云容器引擎 CCE

Master节点SSH连通性检查异常处理检查项内容该检查通过尝试建立SSH连接，检查CCE是否能通过SSH方式连接至您的Master节点。解决方案 SSH连通性检查可能有较低概率因为网络波动检查失败，请您优先重试升级前检查；若重试检查仍无法通过检查，请您提交工单，联系技术支持人员排查。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
挂载文件存储的节点，Pod创建删除卡死 - 云容器引擎 CCE

挂载文件存储的节点，Pod创建删除卡死故障现象在挂载文件存储（SFS或SFS Turbo）的节点上，删除Pod卡在“结束中”，创建Pod卡在“创建中”。可能原因后端文件存储被删除，导致无法访问挂载点。节点与文件存储间网络异常，导致无法访问挂载点。解决方案登录挂载文件

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？问题现象当集群中存在GPU/NPU节点和普通节点混合使用的场景时，普通工作负载也可以调度到GPU/NPU节点上，可能出现GPU/NPU资源未充分利用的情况。问题原因由于GPU/NPU节点同样提供CPU、内存资源，在一般情况下，

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

od全部运行在目标节点上，即节点包含gpu=true标签。工作负载节点亲和性规则通过节点标签实现。CCE集群中节点在创建时会自动添加一些标签，常用的节点标签如下（更多标签请参见节点固有标签）： topology.kubernetes.io/zone：表示节点所在的可用区（availability

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 调度工作负载

总条数： 1052

上一页
1
...
10
11
12
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

节点命令行检查异常处理 - 云容器引擎 CCE

创建节点时执行安装前/后脚本 - 云容器引擎 CCE

检查节点镜像数量异常处理 - 云容器引擎 CCE

查询指定节点池支持配置的参数内容 - 云容器引擎 CCE

如何批量修改集群node节点安全组？ - 云容器引擎 CCE

节点配置文件检查异常处理 - 云容器引擎 CCE

更改集群节点的默认安全组 - 云容器引擎 CCE

节点NetworkManager检查异常处理 - 云容器引擎 CCE

cgroup统计资源异常导致kubelet驱逐Pod - 云容器引擎 CCE

节点交换区检查异常处理 - 云容器引擎 CCE

节点本地域名解析加速 - 云容器引擎 CCE

节点标签更新导致的Pod容器退出问题 - 云容器引擎 CCE

节点配置一致性检查异常处理 - 云容器引擎 CCE

集群节点使用networkpolicy概率性出现panic问题 - 云容器引擎 CCE

节点CPU使用率检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理 - 云容器引擎 CCE

Master节点SSH连通性检查异常处理 - 云容器引擎 CCE

挂载文件存储的节点，Pod创建删除卡死 - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线