搜索_华为云

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？问题现象当集群中存在GPU/NPU节点和普通节点混合使用的场景时，普通工作负载也可以调度到GPU/NPU节点上，可能出现GPU/NPU资源未充分利用的情况。问题原因由于GPU/NPU节点同样提供CPU、内存资源，在一般情况下，

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
节点交换区检查异常处理 - 云容器引擎 CCE

节点交换区检查异常处理检查项内容检查集群CCE节点的上是否开启了交换区。解决方案 CCE节点默认关闭swap交换区，请您确认手动开启交换区的原因，并确定关闭影响；若确定无影响后请执行swapoff -a命令关闭交换区之后重新检查。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点上CCE Agent版本检查异常处理 - 云容器引擎 CCE

一致，请将异常节点的OBS地址修改为正确地址。通过以下命令下载最新的二进制文件。 x86系统 curl -k "https://{您获取的obs地址}/cluster-versions/base/cce-agent" > /tmp/cce-agent ARM系统 curl -k

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
残留待迁移节点检查异常处理 - 云容器引擎 CCE

重置节点”，详情请参见重置节点。节点重置完毕后，重试检查任务。图1 重置节点重置节点会重置所有节点标签，可能影响工作负载调度，请在重置节点前检查并保留您手动为该节点打上的标签。解决方案二新建节点后，删除问题节点。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点sock文件挂载检查异常处理 - 云容器引擎 CCE

节点sock文件挂载检查异常处理检查项内容检查节点上的Pod是否直接挂载docker/containerd.sock文件。升级过程中Docker/Containerd将会重启，宿主机sock文件发生变化，但是容器内的sock文件不会随之变化，二者不匹配，导致您的业务无法访问D

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

v1.21 v1.23 v1.25 v1.27 v1.28 v1.29 v1.30 兼容单系统盘支持插件实例AZ反亲和配置支持在竞价实例被释放前给节点加污点，驱逐节点上的pod 插件挂载节点时区适配CCE v1.30集群 0.8.10 1.19.1 v1.21 v1.23 v1

帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 插件版本发布记录
集群节点使用networkpolicy概率性出现panic问题 - 云容器引擎 CCE

canal-agent 回显如图：解决办法如果您希望继续使用该节点资源，建议重置所属集群中的CentOS 7.6节点，以升级节点上网络组件到最新版本，具体操作请参考重置节点。如果您希望删除该隐患节点后重新购买，具体操作请参考删除节点、购买节点。父主题：网络异常问题排查

 帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
Master节点规格检查异常处理 - 云容器引擎 CCE

Master节点规格检查异常处理检查项内容检查本次升级集群的Master节点规格与实际的Master节点规格是否一致。解决方案该问题一般因为您进行过Master节点改造，此次升级可能会将您的Master节点重置为标准版本; 如您无法确认影响，请您提交工单联系运维人员支撑。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

Guaranteed BestEffort类型的Pod：系统用完了全部内存时，该类型Pod会最先被终止。 Burstable类型的Pod：系统用完了全部内存，且没有BestEffort容器可以终止时，该类型Pod会被终止。 Guaranteed类型的Pod：系统用完了全部内存、且没有Burstabl

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
用户节点组件健康检查异常处理 - 云容器引擎 CCE

用户节点组件健康检查异常处理检查项内容检查用户节点的容器运行时组件和网络组件等是否健康。解决方案问题场景一：CNI Agent is not active 如果您的集群版本在1.17.17以下，或者1.17.17以上且是隧道网络，请登录该节点，执行systemctl status

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
Master节点时区检查 - 云容器引擎 CCE

Master节点时区检查检查项内容检查到您集群中Master节点实际时区与集群时区不一致，滚动升级后Master节点上的时区会变为集群时区。如果您集群中存在Cronjob，则可能会导致Cronjob在升级后触发一次非预期的执行。解决方案请在升级前关闭Cronjob后再次

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点运行时检查异常处理 - 云容器引擎 CCE

节点运行时检查异常处理检查项内容该告警通常发生在低版本集群升级到v1.27及以上集群。CCE不建议您在1.27以上版本集群中继续使用docker，并计划在未来移除对docker的支持。解决方案若您的节点的运行时非containerd，您可通过节点重置功能重置节点的运行时为containerd。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
EulerOS 2.9内核缺陷导致虚拟机卡住 - 云容器引擎 CCE

EulerOS 2.9内核缺陷导致虚拟机卡住故障现象 EulerOS 2.9节点上，由于内核存在调度相关的社区问题，有低概率会触发死锁，表现为虚拟机卡住。影响范围 x86内核版本：4.18.0-147.5.1.6.h1152.eulerosv2r9.x86_64 arm内核版本：4

帮助中心 > 云容器引擎 CCE > 常见问题 > 节点 > 操作系统问题说明
节点干扰ContainerdSock检查异常处理 - 云容器引擎 CCE

节点干扰ContainerdSock检查异常处理检查项内容检查节点上是否存在干扰的Containerd.Sock文件。该文件影响Euler操作系统下的容器运行时启动。解决方案问题场景：节点使用的docker为定制的Euler-docker而非社区的docker 登录相关节点。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点无法连接互联网（公网），如何排查定位？ - 云容器引擎 CCE

节点无法连接互联网（公网），如何排查定位？当节点无法连接互联网时，请参照如下方法排查。排查项一：节点是否绑定弹性IP 登录ECS控制台，查看节点对应的弹性云服务器是否已绑定弹性IP。若弹性IP一栏有IP地址，表示已绑定弹性IP。若没有，请为弹性云服务器绑定弹性IP。图1 节点是否已绑定弹性IP

帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络异常问题排查
CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

CCE推荐的GPU驱动版本列表对于CCE集群，各系统推荐使用驱动版本如下表，若使用非CCE推荐驱动版本，需要您自行验证机型、系统及驱动版本间的配套兼容性。您可以根据您的应用所使用的CUDA Toolkit版本，对照CUDA Toolkit与NVIDIA驱动的版本兼容性列表，选择合适的NVIDIA驱动版本。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
节点池运行时检查异常处理 - 云容器引擎 CCE

节点池运行时检查异常处理检查项内容该告警通常发生在低版本集群升级到v1.27及以上集群。CCE不建议您在1.27以上版本集群中继续使用docker，并计划在未来移除对docker的支持。解决方案若您的节点池的运行时非containerd，您可通过更新节点池功能将节点池的运行时修改为containerd。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
查询指定节点池支持配置的参数列表 - 云容器引擎 CCE

查询指定节点池支持配置的参数列表功能介绍该API用于查询CCE服务下指定节点池支持配置的参数列表。调用方法请参见如何调用API。 URI GET /api/v3/projects/{project_id}/clusters/{cluster_id}/nodepools/{

帮助中心 > 云容器引擎 CCE > API参考 > API > 配置管理
使用节点本地域名解析加速（NodeLocal DNSCache）提升DNS性能 - 云容器引擎 CCE

odeLocal DNSCache来提升服务发现的稳定性和性能。NodeLocal DNSCache会在集群节点上运行DNS缓存代理，所有注入DNS配置的Pod都会使用节点上运行的DNS缓存代理进行域名解析，而不是使用CoreDNS服务，以此来减少CoreDNS服务的压力，提高集群DNS性能。

帮助中心 > 云容器引擎 CCE > 用户指南 > 网络 > DNS
使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

%时，关联的节点池都增加一个节点。CA策略需要关联节点池，可以关联多个节点池，当需要对节点扩缩容时，在节点池中根据最小浪费规则挑选合适规格的节点扩缩容。节点数范围：修改节点数范围，弹性伸缩时节点池下的节点数量会始终介于节点数范围内。冷却时间：当前节点池扩容出的节点多长时间不能被缩容。

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩

总条数： 1100

上一页
1
...
11
12
13
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

节点交换区检查异常处理 - 云容器引擎 CCE

节点上CCE Agent版本检查异常处理 - 云容器引擎 CCE

残留待迁移节点检查异常处理 - 云容器引擎 CCE

节点sock文件挂载检查异常处理 - 云容器引擎 CCE

CCE节点故障检测插件版本发布记录 - 云容器引擎 CCE

集群节点使用networkpolicy概率性出现panic问题 - 云容器引擎 CCE

Master节点规格检查异常处理 - 云容器引擎 CCE

如何避免节点上的某个容器被驱逐？ - 云容器引擎 CCE

用户节点组件健康检查异常处理 - 云容器引擎 CCE

Master节点时区检查 - 云容器引擎 CCE

节点运行时检查异常处理 - 云容器引擎 CCE

EulerOS 2.9内核缺陷导致虚拟机卡住 - 云容器引擎 CCE

节点干扰ContainerdSock检查异常处理 - 云容器引擎 CCE

节点无法连接互联网（公网），如何排查定位？ - 云容器引擎 CCE

CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

节点池运行时检查异常处理 - 云容器引擎 CCE

查询指定节点池支持配置的参数列表 - 云容器引擎 CCE

使用节点本地域名解析加速（NodeLocal DNSCache）提升DNS性能 - 云容器引擎 CCE

使用HPA+CA实现工作负载和节点联动弹性伸缩 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线