搜索_华为云

异构资源配置 - 云容器引擎 CCE

公网地址。节点池配置：若您不希望集群中的所有GPU节点使用相同的驱动，CCE支持以节点池为单位安装不同的GPU驱动。配置节点池自定义驱动后，节点池中节点优先使用当前节点池自定义驱动，未指定驱动的节点将使用集群默认驱动。系统将根据节点池指定的驱动版本进行安装，仅对节点池新建节点生效。

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

GPU）插件是支持在容器中使用GPU显卡的设备管理插件，集群中使用GPU节点时必须安装本插件。字段说明表1 参数描述参数是否必选参数类型描述 basic 是 object 插件基础配置参数。 custom 是表3 object 插件自定义参数表2 basic 参数

 帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
Grafana - 云容器引擎 CCE
Grafana - 云容器引擎 CCE

数据源。安装插件登录CCE控制台，单击集群名称进入集群，单击左侧导航栏的“插件中心”，在右侧找到Grafana，单击“安装”。设置插件的“规格配置”，您可根据需求调整插件实例的CPU配额和内存配额。设置插件支持的“参数配置”。表1 Grafana插件参数配置参数参数说明

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 云原生可观测性插件
云容器引擎-成长地图 - 云容器引擎 CCE

快速创建CCE集群通过镜像创建无状态工作负载高阶部署有依赖关系的wordpress应用 05 实践您可以在CCE上部署或迁移各种类型的网站和服务，满足您的业务所需。将自建K8S集群迁移到CCE Jenkins安装部署及对接SWR和CCE集群使用Kubeflow和Volcano实现典型AI训练任务

 帮助中心 > 云容器引擎 CCE > 成长地图
GPU插件检查异常处理 - 云容器引擎 CCE

点时GPU驱动的安装。解决方案由于当前GPU插件的驱动配置由您自行配置，需要您验证两者的兼容性。建议您在测试环境验证安装升级目标版本的GPU插件，并配置当前GPU驱动后，测试创建节点是否正常使用。您可以执行以下步骤确认GPU插件的升级目标版本与当前驱动配置。登录CCE控制台，前往“插件中心”处查看CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
节点Python命令检查异常处理 - 云容器引擎 CCE

检查方式 /usr/bin/python --version echo $? 如果回显值不为0证明检查失败。解决方案可优先重置节点或手动安装Python之后再进行升级。父主题：升级前检查异常问题排查

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群 > 升级前检查异常问题排查
重置节点 - 云容器引擎 CCE
重置节点 - 云容器引擎 CCE

理机，且操作系统选择私有镜像时支持）保留所选择镜像的密码。为了保证您的正常使用，请确保所选择镜像中已经设置了密码。存储配置配置节点云服务器上的存储资源，方便节点上的容器软件与容器应用使用。表2 存储配置参数参数参数说明系统盘直接使用云服务器的系统盘。系统组件存储

 帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 管理节点
CCE集群创建失败的原因与解决方法？ - 云容器引擎 CCE

CCE集群创建失败的原因与解决方法？概述本文主要介绍在CCE集群创建失败时，如何查找失败的原因，并解决问题。详细信息集群创建失败的原因包括： ntpd没安装或者安装失败、k8s组件预校验不过、磁盘分区错误等，目前只能尝试重新创建，定位方法请参见定位失败原因。当前集群规模所需的底层资源不足，请选择其他规模的集群类型后重新创建集群。

帮助中心 > 云容器引擎 CCE > 常见问题 > 集群 > 集群创建
插件异常问题排查 - 云容器引擎 CCE

le资源，但是该资源不是由插件管理的。解决方案手动使用kubectl删除非插件管理的冲突的资源后，重试插件的安装。安装超时问题现象安装/升级插件时，提示安装失败，错误信息显示 timed out。 Release "*****" failed: failed pre-install:

帮助中心 > 云容器引擎 CCE > 常见问题 > 模板插件
搭建Jenkins和Gitlab环境 - 云容器引擎 CCE

如以下命令无法自动化安装，请根据操作系统进行手动安装，详细操作请参见Docker Engine installation。 dnf install docker 查看Docker是否安装成功。 docker info Gitlab安装及配置拉取 Gitlab 镜像。 docker

帮助中心 > 云容器引擎 CCE > 最佳实践 > DevOps > 使用Jenkins和Gitlab实现多集群隔离的DevOps流程 > 实施步骤
集群配置概览 - 云容器引擎 CCE

集群配置概览集群配置中心为您提供集群基础配置的概况及对应的修改入口，包含集群信息、集群配置、集群控制节点可用区和已安装插件多维度的信息概况。功能入口登录CCE控制台，单击集群名称进入集群详情页。在左侧导航栏中选择“配置中心”，单击“配置概览”页签。图1 配置概览集群信息

 帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
通过模板部署应用 - 云容器引擎 CCE

通过模板部署应用在CCE控制台上，您可以上传Helm模板包，然后在控制台安装部署，并对部署的实例进行管理。 CCE从2022年9月开始，各region将逐步切换至Helm v3。模板管理不再支持Helm v2版本的模板，若您在短期内不能切换至Helm v3，可通过Helm v2

帮助中心 > 云容器引擎 CCE > 用户指南 > 模板（Helm Chart）
GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

步骤二：异构资源配置单击左侧导航栏的“配置中心”，选择“异构资源配置”页签。在“GPU配置”中找到“节点池配置”，并选择新增的目标节点池。参考准备GPU虚拟化资源，选择满足GPU虚拟化要求的驱动，并开启支持GPU虚拟化。图1 异构资源配置单击“确认配置”进行保存。步骤三：创建GPU虚拟化负载并扩容

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
及时升级集群中的CoreDNS版本 - 云容器引擎 CCE

登录CCE控制台，选择一个集群，在左侧导航栏中单击“插件中心”。找到CoreDNS插件，单击“升级”按钮。根据页面提示填写插件安装参数，详细说明请参见CoreDNS（系统资源插件，必装）。父主题：客户端

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 网络 > CoreDNS配置优化实践 > 客户端
系统委托说明 - 云容器引擎 CCE

系统委托说明由于CCE在运行中对计算、存储、网络以及监控等各类云服务资源都存在依赖关系，因此当您首次登录CCE控制台时，CCE将自动请求获取当前区域下的云资源权限，从而更好地为您提供服务。服务权限包括：计算类服务 CCE集群创建节点时会关联创建云服务器，因此需要获取访问弹性云服务器、裸金属服务器的权限。

帮助中心 > 云容器引擎 CCE > 用户指南 > 权限
CCE AI套件（Ascend NPU） - 云容器引擎 CCE

NPU）是支持容器里使用NPU设备的管理插件。安装本插件后，可创建“AI加速型”节点，实现快速高效地处理推理和图像识别等工作。字段说明表1 参数描述参数是否必选参数类型描述 basic 否 object 插件基础配置参数，无需指定。 flavor 是表3 object

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow 资源准备购买CCE集群，购买GPU节点并使用gpu-beta插件安装显卡驱动。在集群下添加一个对象存储卷。数据预置从https://github.com/zalandoresearch/fashion-mnist下载数据。获取

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
配置节点故障检测策略 - 云容器引擎 CCE

您可单击“指标异常”，按照修复建议提示修复。自定义检查项配置登录CCE控制台，单击集群名称进入集群。在左侧选择“节点管理”，切换至“节点”页签，单击“故障检测策略”。在跳转的页面中查看当前检查项配置，单击检查项操作列的“编辑”，自定义检查项配置。当前支持以下配置：启用/停用：自定义某个检查项的开启或关闭。

帮助中心 > 云容器引擎 CCE > 用户指南 > 节点 > 节点运维
Kubernetes Dashboard - 云容器引擎 CCE

（3.0.2及以上版本支持）在安装插件页面，设置“规格配置”。表1 插件规格配置参数参数说明插件规格该插件可配置系统预置规格或自定义规格。容器选择自定义规格时，您可根据需求调整插件实例的容器规格。在参数配置页面，配置以下参数。访问方式：支持“节点访问”，通过集群节

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件 > 其他插件
GPU故障处理 - 云容器引擎 CCE
GPU故障处理 - 云容器引擎 CCE

GPU故障处理前提条件如需将GPU事件同步上报至AOM，集群中需安装云原生日志采集插件，您可前往AOM服务查看GPU插件隔离事件。 GPU插件隔离事件当GPU显卡出现异常时，系统会将出现问题的GPU设备进行隔离，详细事件如表1所示。表1 GPU插件隔离事件事件原因详细信息

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度

总条数： 1152

上一页
1
...
4
5
6
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

异构资源配置 - 云容器引擎 CCE

CCE AI套件（NVIDIA GPU） - 云容器引擎 CCE

Grafana - 云容器引擎 CCE

云容器引擎-成长地图 - 云容器引擎 CCE

GPU插件检查异常处理 - 云容器引擎 CCE

节点Python命令检查异常处理 - 云容器引擎 CCE

重置节点 - 云容器引擎 CCE

CCE集群创建失败的原因与解决方法？ - 云容器引擎 CCE

插件异常问题排查 - 云容器引擎 CCE

搭建Jenkins和Gitlab环境 - 云容器引擎 CCE

集群配置概览 - 云容器引擎 CCE

通过模板部署应用 - 云容器引擎 CCE

GPU虚拟化节点弹性伸缩配置 - 云容器引擎 CCE

及时升级集群中的CoreDNS版本 - 云容器引擎 CCE

系统委托说明 - 云容器引擎 CCE

CCE AI套件（Ascend NPU） - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

配置节点故障检测策略 - 云容器引擎 CCE

Kubernetes Dashboard - 云容器引擎 CCE

GPU故障处理 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线