搜索_华为云

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

/usr/local/nvidia/bin && ./nvidia-smi 登录CCE控制台，单击集群名称进入集群，在左侧选择“配置中心”。切换至“异构资源配置”页签，在“节点池自定义驱动”下方选择需要更新驱动的节点池及驱动，或者选择填写自定义驱动链接。本文档中更新后的驱动为535.54.03。单击“确认配置”。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU节点驱动版本
新建Pod检查 - 云容器引擎 CCE
新建Pod检查 - 云容器引擎 CCE

检查集群升级后，新建节点是否能新建Pod。检查步骤基于新建节点检查创建了新节点后，通过创建DaemonSet类型工作负载，在每个节点上创建Pod。登录CCE控制台，单击集群名称进入集群。在导航栏中选择“工作负载”，单击右上角“创建工作负载”或“YAML创建”。创建DaemonSet的操

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级后验证
NPU调度 - 云容器引擎 CCE
NPU调度 - 云容器引擎 CCE

通过huawei.com/ascend-310指定申请NPU的数量。使用huawei.com/ascend-310参数指定NPU数量时，requests和limits值需要保持一致。指定huawei.com/ascend-310后，在调度时不会将负载调度到没有NPU的节点。如果缺乏NPU资源，会报类似“0/2

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
异构资源配置 - 云容器引擎 CCE

业务稳定的前提下，可以完全由用户自己定义使用的GPU量，提高GPU利用率。详情请参见GPU虚拟化概述。集群默认驱动：集群中GPU节点默认使用的GPU驱动版本。如果选择“自定义驱动链接地址”，则需填写Nvidia驱动的下载链接，详情请参见获取驱动链接-公网地址。节点池配置：若您

 帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
是否可以直接连接CCE集群的控制节点？ - 云容器引擎 CCE

是否可以直接连接CCE集群的控制节点？ CCE支持使用Kubectl工具连接集群，具体请参见通过Kubectl连接集群。 CCE不支持登录控制节点执行相关操作。父主题：集群运行

 帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群运行
使用kubectl自动创建文件存储 - 云容器引擎 CCE

PVC。约束与限制如下配置示例适用于Kubernetes 1.13及以下版本的集群。操作步骤请参见通过kubectl连接集群，使用kubectl连接集群。执行如下命令，配置名为“pvc-sfs-auto-example.yaml”的创建PVC的yaml文件。 touch

帮助中心 > 云容器引擎 CCE > 用户指南 > 存储管理-Flexvolume（已弃用） > 文件存储卷
残留待迁移节点检查异常处理 - 云容器引擎 CCE

检查节点是否需要迁移。解决方案该问题由于节点拉包组件异常或节点由比较老的版本升级而来，导致节点上缺少关键的系统组件导致。解决方案一请登录CCE控制台，单击集群名称进入集群控制台，前往“节点管理”页面，单击对应节点的“更多 > 重置节点”，详情请参见重置节点。节点重置完毕后，重试检查任务。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
排水任务检查异常处理 - 云容器引擎 CCE

检查到集群中存在未完成的排水任务，此时升级可能会导致升级完成后触发排水动作，将运行中的Pod进行驱逐。解决方案配置Kubectl命令，具体请参见通过kubectl连接集群。查看是否存在排水任务，以下为正常回显： kubectl get drainage 图1 排水任务，以下回显表示存在排水任务请将d

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
kube-prometheus-stack插件实例调度失败如何解决？ - 云容器引擎 CCE

首次安装kube-prometheus-stack插件时，prometheus实例会延迟绑定云硬盘类型的存储卷（PVC名为pvc-prometheus-server-0），创建该云硬盘时可用区会自动与实例运行的节点所在可用区保持一致。例如实例运行的节点可用区为可用区1，则该云硬盘的可用区也为可用区1。

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
负载均衡器自动创建配置 - 云容器引擎 CCE

autocreate 结构体json 无允许 CCE Standard/CCE Turbo 自动创建负载均衡器场景必填参数，根据所需填写。负载均衡器和集群必须在一个VPC内父主题：服务

 帮助中心 > 云容器引擎 CCE > 配置参考 > 服务
负载均衡器自动创建配置 - 云容器引擎 CCE

autocreate 结构体json 无允许 CCE Standard/CCE Turbo 自动创建负载均衡器场景必填参数，根据所需填写。负载均衡器和集群必须在一个VPC内父主题：路由

 帮助中心 > 云容器引擎 CCE > 配置参考 > 路由
模板管理 - 云容器引擎 CCE
模板管理 - 云容器引擎 CCE

模板管理上传模板获取模板列表获取模板实例列表更新模板创建模板实例删除模板更新指定模板实例获取模板删除指定模板实例下载模板获取指定模板实例获取模板Values 查询指定模板实例历史记录获取用户模板配额父主题： API

帮助中心 > 云容器引擎 CCE > API参考 > API
集群与节点池配置管理检查 - 云容器引擎 CCE

置管理异常。 nodepool id(master)表示集群配置管理异常。问题场景一：节点池配置管理异常修复节点池异常配置步骤如下：登录CCE控制台，进入“节点管理”。找到问题节点池，单击“更多”并选择“配置管理”。选择“网络组件配置（eni）”，修改节点池级别的节点预热容器网卡回收阈值

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU插件检查异常处理 - 云容器引擎 CCE

目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。登录CCE控制台，前往“插件中心”处查看CCE AI套件（NVIDIA GPU）插件。单击该插件的“升级”按钮，查看插件目标版本及驱动版本。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
GPU插件关键参数检查异常处理 - 云容器引擎 CCE

检查项内容检查CCE GPU插件中部分配置是否被侵入式修改，被侵入式修改的插件可能导致升级失败。解决方案使用kubectl连接集群。执行以下命令获取插件实例详情。 kubectl get ds nvidia-driver-installer -nkube-system -oyaml

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？问题现象当集群中存在GPU/NPU节点和普通节点混合使用的场景时，普通工作负载也可以调度到GPU/NPU节点上，可能出现GPU/NPU资源未充分利用的情况。问题原因由于GPU/NPU节点同样提供CPU、内存资源，在一般

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 调度策略
工作负载异常：实例无法写入数据 - 云容器引擎 CCE

工作负载异常：实例无法写入数据 Pod事件 Pod所在的节点文件系统损坏，新建的Pod无法成功在/var/lib/kubelet/device-plugins/.xxxxx写入数据，Pod通常会出现以下类似事件： Message： Pod Update Plugin resources

帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
设置资源配额及限制 - 云容器引擎 CCE

设置资源配额及限制 Kubernetes在一个物理集群上提供了多个虚拟集群，这些虚拟集群被称为命名空间。命名空间可用于多种工作用途，满足多用户、多环境、多应用的使用需求，通过为每个命名空间配置包括CPU、内存、Pod数量等资源的额度可以有效限制资源滥用，从而保证集群的可靠性，更多信息请参见资源配额。

帮助中心 > 云容器引擎 CCE > 用户指南 > 命名空间
CCE是否支持余额不足提醒？ - 云容器引擎 CCE

CCE是否支持余额不足提醒？用户可在费用中心总览页面“可用额度”区域单击“设置”，设置“可用额度预警”后的开关，即可开通或关闭可用额度预警功能。单击“修改”，可以对预警阈值进行修改。开通后，当可用额度（含现金余额、信用余额、通用代金券、现金券）的总金额低于预警阈值时，会每天给联系人发送短信和邮件提醒，最多连续提醒3天。

帮助中心 > 云容器引擎 CCE > 常见问题 > 计费类
CRI-O容器运行时引擎任意代码执行漏洞（CVE-2022-0811） - 云容器引擎 CCE

意内核参数。这将导致任何有权在使用CRI-O的Kubernetes集群上部署Pod的用户都可以滥用kernel.core_pattern内核参数，在集群中的任何节点上以root身份实现容器逃逸和执行任意代码。该问题已被收录为CVE-2022-0811。表1 漏洞信息漏洞类型

 帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告

总条数： 1381

上一页
1
...
53
54
55
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过节点池升级节点的GPU驱动版本 - 云容器引擎 CCE

新建Pod检查 - 云容器引擎 CCE

NPU调度 - 云容器引擎 CCE

异构资源配置 - 云容器引擎 CCE

是否可以直接连接CCE集群的控制节点？ - 云容器引擎 CCE

使用kubectl自动创建文件存储 - 云容器引擎 CCE

残留待迁移节点检查异常处理 - 云容器引擎 CCE

排水任务检查异常处理 - 云容器引擎 CCE

kube-prometheus-stack插件实例调度失败如何解决？ - 云容器引擎 CCE

负载均衡器自动创建配置 - 云容器引擎 CCE

负载均衡器自动创建配置 - 云容器引擎 CCE

模板管理 - 云容器引擎 CCE

集群与节点池配置管理检查 - 云容器引擎 CCE

GPU插件检查异常处理 - 云容器引擎 CCE

GPU插件关键参数检查异常处理 - 云容器引擎 CCE

如何避免非GPU/NPU负载调度到GPU/NPU节点？ - 云容器引擎 CCE

工作负载异常：实例无法写入数据 - 云容器引擎 CCE

设置资源配额及限制 - 云容器引擎 CCE

CCE是否支持余额不足提醒？ - 云容器引擎 CCE

CRI-O容器运行时引擎任意代码执行漏洞（CVE-2022-0811） - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线