搜索_华为云

控制台访问异常问题排查 - 云容器引擎 CCE

控制台访问异常问题排查访问容器组日志时报错若您在查看容器组日志时遇到该问题，而集群其他资源均可正常访问，您可以按以下步骤排查。登录CCE控制台，单击集群名称进入集群。选择左侧导航栏的“工作负载”，查看工作负载容器组运行状态是否为“运行中”，若不是，请根据工作负载状态异常定位方法进行排查。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
手动更新GPU节点驱动版本 - 云容器引擎 CCE

168.1.xx drained 如果有DaemonSet工作负载使用了GPU卡，则需要先停止kubelet和containerd运行时服务。登录需要更新GPU驱动的节点，如192.168.1.xx。停止服务(containerd运行时) systemctl stop kubelet

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

通过控制台配置通过YAML配置本文示例中，集群内已创建GPU节点，并设置标签为gpu=true，您可以通过该标签将Pod调度到GPU节点上。登录CCE控制台。单击集群名称进入集群，在左侧选择“工作负载”，在右上角单击“创建工作负载”。在创建工作负载时，在“高级设置”中找到“调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 调度工作负载
管理工作负载弹性伸缩策略 - 云容器引擎 CCE

、编辑YAML以及删除等操作。操作步骤您可以查看工作负载弹性策略的规则、最新状态和事件，参照界面中的报错提示有针对性的解决异常事件。登录CCE控制台，单击集群名称进入集群。在左侧导航栏中单击“策略”，在“弹性伸缩策略”页签下，根据弹性伸缩策略类型选择HPA / CronHPA

帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 工作负载弹性伸缩
容器与节点时区同步 - 云容器引擎 CCE

场景二：容器、容器日志与节点时区同步场景三：工作负载与节点时区同步场景一：容器与节点时区同步登录CCE控制台。在创建工作负载基本信息页面，开启“时区同步”，即容器与节点使用相同时区。图1 开启时区同步登录节点进入容器查询容器时区是否与节点保持一致。 date -R 命令行终端显示如下信息：

帮助中心 > 云容器引擎 CCE > 最佳实践 > 容器
修改节点日志缓存内存占用量上限RuntimeMaxUse - 云容器引擎 CCE

用较大内存。修改节点系统参数的命令仅在使用公共镜像时有效，使用私有镜像时本文中提供的命令仅供参考。修改节点RuntimeMaxUse 登录节点，查看/etc/systemd/journald.conf文件。 cat /etc/systemd/journald.conf 修改R

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维 > 节点系统参数优化
GPU虚拟化概述 - 云容器引擎 CCE

兼容：业务无需重新编译，无需进行CUDA库替换，对业务无感。前提条件配置支持版本集群版本 v1.23.8-r0、v1.25.3-r0及以上操作系统 Huawei Cloud EulerOS 2.0操作系统 GPU类型支持T4、V100类型的GPU 驱动版本 GPU虚拟化功能仅支持470.57.02、510

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
Caffe分类范例 - 云容器引擎 CCE
Caffe分类范例 - 云容器引擎 CCE

py。挂载刚刚导入的OBS存储盘：单击“创建”。等待job执行完成，进入OBS存储盘的outputimg下，可以看到推理使用的图片。登录在集群中添加GPU节点添加的节点，执行docker logs {容器id}查看归类结果，可以看到结果：tabby cat。使用GPU 创

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
管理工作负载 - 云容器引擎 CCE

监控您可以通过CCE控制台查看工作负载和容器组的CPU和内存占用情况，以确定需要的资源规格。本文以无状态工作负载为例说明如何使用监控功能。登录CCE控制台，进入一个已有的集群，在左侧导航栏中选择“工作负载”。选择“无状态负载”页签，单击已创建工作负载后的“监控”。在监控页面，可

 帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
创建VPC和子网 - 云容器引擎 CCE

在创建集群之前，您需要创建虚拟私有云（VPC），为CCE服务提供一个安全、隔离的网络环境。如果用户已有VPC，可重复使用，不需多次创建。创建VPC 登录管理控制台，选择“网络 > 虚拟私有云 VPC”。在虚拟私有云控制台，单击右上角的“创建虚拟私有云”，按照提示完成创建。创建完成后返回

 帮助中心 > 云容器引擎 CCE > API参考 > 附录
如何配置集群的访问策略 - 云容器引擎 CCE

为集群绑定公网API Server地址后，建议修改控制节点5443端口的安全组规则，加固集群的访问控制策略。登录CCE控制台，单击集群名称进入集群，在总览页面找到“集群ID”并复制。登录VPC控制台，在左侧导航栏中选择“访问控制 > 安全组”。在筛选栏中，选择筛选条件为“描述”，并粘贴集群ID进行筛选。

帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 安全加固
如何确认网卡不被集群占用？ - 云容器引擎 CCE

用和集群预热的网卡。操作步骤登录CCE控制台，单击集群列表中的集群名称。在左侧导航栏中选择“配置中心”，切换至“网络配置”页签。查看“容器网络配置”，以default-network（默认容器子网）为例，复制容器子网的“网络ID”。登录VPC控制台，在左侧导航栏中选择“

帮助中心 > 云容器引擎 CCE > 常见问题 > 网络管理 > 网络指导
ELB IPv4私网地址检查异常处理 - 云容器引擎 CCE

tothese elbs and try again 方法二：登录CCE控制台，前往“服务”页面查看服务，单击ELB名称，跳转到ELB界面。确认ELB实例是否包含IPv4私网IP。为无IPv4私网IP地址的ELB绑定一个私网IP。登录CCE控制台，单击目标ELB名称。在基本信息页面，单击“IPv4私有IP”旁的“绑定”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
根据GPU/NPU卡信息定位使用该卡的Pod - 云容器引擎 CCE

后使用kubectl搜索到使用该卡的Pod。 GPU场景 NPU场景登录CCE控制台，在左侧导航栏中选择“节点管理”，切换至“节点”页签，查看GPU节点的IP。本文中以192.168.0.106为例。登录GPU节点，通过以下命令查看GPU卡的信息。 nvidia-smi 可以

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

如果您需要安装最新版本的GPU驱动，请将您的GPU插件升级到最新版本。表1 GPU驱动支持列表 GPU型号支持集群类型机型规格操作系统 Huawei Cloud EulerOS 2.0（支持GPU虚拟化） Ubuntu 22.04.4 Ubuntu 22.04.3 CentOS Linux release

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
管理节点弹性策略 - 云容器引擎 CCE

在节点池详情中切换至“弹性伸缩”页签，可以看到弹性伸缩策略的配置及伸缩记录。图1 查看弹性伸缩策略您还可以在“策略”页面中查看已创建的弹性伸缩策略：登录CCE控制台，单击集群名称进入集群。在左侧导航栏中单击“策略”，切换至“节点伸缩策略”页签。您可以查看弹性伸缩策略的配置。单击要策略后方的“更多

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩 > 节点弹性伸缩
安全组检查异常处理 - 云容器引擎 CCE

源地址为Master节点安全组的规则是否被删除。仅VPC网络模型的集群执行该检查项，非VPC网络模型的集群将跳过该检查项。解决方案请登录VPC控制台，前往“访问控制 > 安全组”，在搜索框内输入集群名称，此时预期过滤出两个安全组：安全组名称为“集群名称-node-xxx”，此安全组关联CCE用户节点。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
网络 - 云容器引擎 CCE
网络 - 云容器引擎 CCE

用户租户下存在的VPC ID 无支持初始化时配置，不支持后续修改 CCE Standard/CCE Turbo 获取方法如下：方法1：登录虚拟私有云服务的控制台界面，在虚拟私有云的详情页面查找VPC ID。方法2：通过虚拟私有云服务的API接口查询。配置建议： VPC在集

 帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
使用CCE需要关注哪些配额限制？ - 云容器引擎 CCE

限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。如果当前资源配额限制无法满足使用需要，您可以申请扩大配额。怎样查看我的配额？登录管理控制台。单击管理控制台左上角的，选择区域和项目。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群创建
残留待迁移节点检查异常处理 - 云容器引擎 CCE

检查节点是否需要迁移。解决方案该问题由于节点拉包组件异常或节点由比较老的版本升级而来，导致节点上缺少关键的系统组件导致。解决方案一请登录CCE控制台，单击集群名称进入集群控制台，前往“节点管理”页面，单击对应节点的“更多 > 重置节点”，详情请参见重置节点。节点重置完毕后，重试检查任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查

总条数： 660

上一页
1
...
16
17
18
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

控制台访问异常问题排查 - 云容器引擎 CCE

手动更新GPU节点驱动版本 - 云容器引擎 CCE

设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

管理工作负载弹性伸缩策略 - 云容器引擎 CCE

容器与节点时区同步 - 云容器引擎 CCE

修改节点日志缓存内存占用量上限RuntimeMaxUse - 云容器引擎 CCE

GPU虚拟化概述 - 云容器引擎 CCE

Caffe分类范例 - 云容器引擎 CCE

管理工作负载 - 云容器引擎 CCE

创建VPC和子网 - 云容器引擎 CCE

如何配置集群的访问策略 - 云容器引擎 CCE

如何确认网卡不被集群占用？ - 云容器引擎 CCE

ELB IPv4私网地址检查异常处理 - 云容器引擎 CCE

根据GPU/NPU卡信息定位使用该卡的Pod - 云容器引擎 CCE

CCE推荐的GPU驱动版本列表 - 云容器引擎 CCE

管理节点弹性策略 - 云容器引擎 CCE

安全组检查异常处理 - 云容器引擎 CCE

网络 - 云容器引擎 CCE

使用CCE需要关注哪些配额限制？ - 云容器引擎 CCE

残留待迁移节点检查异常处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线