搜索_华为云

修改CCE集群配置 - 云容器引擎 CCE

集群规格为1000节点及以上时，默认值200 开启GPU共享 enable-gpu-share 是否开启GPU共享，该参数仅v1.23.7-r10、v1.25.3-r0及以上版本集群支持。关闭GPU共享时，需保证集群中的Pod没有使用共享GPU能力（即Pod不存在cce.io/gpu-decision的a

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 管理集群
Volcano调度器 - 云容器引擎 CCE
Volcano调度器 - 云容器引擎 CCE

Volcano调度器插件介绍 Volcano 是一个基于 Kubernetes 的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes 当下缺失的一系列特性。字段说明表1 参数描述参数是否必选参数类型描述 basic

帮助中心 > 云容器引擎 CCE > API参考 > API > 插件实例字段说明
高性能调度 - 云容器引擎 CCE
高性能调度 - 云容器引擎 CCE

在支持AI，大数据等作业的时候提供了高精度的资源调度策略，例如在深度学习场景下计算效率非常重要。以TensorFlow计算为例，配置“ps”和“worker”之间的亲和性，以及“ps”与“ps”之间的反亲和性，可使“ps”和“worker”尽量调度到同一台节点上，从而提升“ps”和“worker”之间进行网络和数

 帮助中心 > 云容器引擎 CCE > 产品介绍 > 应用场景
设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

Kubernetes在调度工作负载时支持将节点作为亲和对象，将工作负载调度至具有指定标签和标签值的节点上。例如，某些节点支持使用GPU算力，则可以使用节点亲和调度，确保高性能计算的Pod最终运行在GPU节点上。配置节点亲和调度策略您可以通过不同的方式配置节点亲和性调度策略，将Pod调度到满足条件的节点。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 调度工作负载
调度策略 - 云容器引擎 CCE
调度策略 - 云容器引擎 CCE

如何查看Pod是否使用CPU绑核？节点关机后Pod不重新调度如何避免非GPU/NPU负载调度到GPU/NPU节点？为什么Pod调度不到某个节点上？修改kubelet参数导致已驱逐的Pod被重新调度根据GPU/NPU卡信息定位使用该卡的Pod 父主题：工作负载

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载
在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow 资源准备购买CCE集群，购买GPU节点并使用gpu-beta插件安装显卡驱动。在集群下添加一个对象存储卷。数据预置从https://github.com/zalandoresearch/fashion-mnist下载数据。获取

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算
XGPU视图 - 云容器引擎 CCE
XGPU视图 - 云容器引擎 CCE

百分比每张GPU卡上的GPU虚拟化设备显存使用率计算公式：显卡上所有XGPU设备的显存使用量之和 / 显卡显存总量 GPU卡-XGPU设备显存分配量字节每张GPU卡上的GPU虚拟化设备的显存总量 GPU卡-XGPU设备显存分配率百分比每张GPU卡上的GPU虚拟化设备的显存总量占这张GPU卡显存总量的比例

 帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 监控中心 > 仪表盘
容器resource资源 - 云容器引擎 CCE

512Mi 允许 - GPU数量参数名取值范围默认值是否允许修改作用范围 nvidia.com/gpu 0-0.99间小数或大于等于1小于等于10的整数无允许 - Kubernetes原生GPU资源配额，配置时limit和request配置相同 GPU虚拟化资源：显存参数名

 帮助中心 > 云容器引擎 CCE > 配置参考 > Pod
弹性伸缩概述 - 云容器引擎 CCE

群增加节点，从而保证业务能够正常提供服务。弹性伸缩在CCE上的使用场景非常广泛，典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。 CCE弹性伸缩 CCE的弹性伸缩能力分为如下两个维度：工作负载弹性伸缩：即调度层弹性，主

 帮助中心 > 云容器引擎 CCE > 用户指南 > 弹性伸缩
Caffe分类范例 - 云容器引擎 CCE
Caffe分类范例 - 云容器引擎 CCE

可以看到推理使用的图片。登录在集群中添加GPU节点添加的节点，执行docker logs {容器id}查看归类结果，可以看到结果：tabby cat。使用GPU 创建一个普通job，镜像输入第三方镜像bvlc/caffe:gpu，设置对应的容器规格。启动命令添加python

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Caffe
NVIDIA Container Toolkit容器逃逸漏洞公告（CVE-2024-0132） - 云容器引擎 CCE

AI套件（NVIDIA GPU）插件或插件版本低于2.0.0，则不涉及该漏洞。 CCE AI套件（NVIDIA GPU）插件老版本命名为：gpu-beta、gpu-device-plugin。如果CCE AI套件（NVIDIA GPU）插件版本大于等于2.0.0，请登录GPU节点执行以下命令：

帮助中心 > 云容器引擎 CCE > 服务公告 > 漏洞公告
目标集群资源规划 - 云容器引擎 CCE

、开发、测试环境以及中低性能数据库等场景。 GPU加速型：提供优秀的浮点计算能力，从容应对高实时、高并发的海量计算场景。P系列适合于深度学习，科学计算，CAE等；G系列适合于3D动画渲染，CAD等。仅支持1.11及以上版本集群添加GPU加速型节点。高性能计算型：实例提供具有更稳

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 迁移 > 将K8s集群迁移到CCE
Volcano调度概述 - 云容器引擎 CCE

Volcano调度概述 Volcano是一个基于Kubernetes的批处理平台，提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性，提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 Volcano

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
集群类型对比 - 云容器引擎 CCE

无用户节点的Serverless版集群，无需对节点的部署、管理和安全性进行维护，并根据CPU和内存资源用量按需付费。使用场景 - 面向有云原生数字化转型诉求的用户，期望通过容器集群管理应用，获得灵活弹性的算力资源，简化对计算、网络、存储的资源管理复杂度。适合对极致性能、资源利用率提升和全场景覆盖有更高诉求的客户。

帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 购买集群
（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

（停止维护）Kubernetes 1.11版本说明云容器引擎（CCE）严格遵循社区一致性认证。本文介绍CCE发布Kubernetes 1.11版本所做的变更说明。表1 v1.11版本集群说明 Kubernetes版本（CCE增强版）版本说明 v1.11.7-r2 主要特性： GPU支持V100类型集群支持权限管理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群概述 > Kubernetes版本发布记录
创建普通任务（Job） - 云容器引擎 CCE

建议请参见设置容器规格。 GPU配额（可选）当集群中包含GPU节点时，才能设置GPU配额，且集群中需安装CCE AI套件（NVIDIA GPU）插件。不使用：表示不使用GPU。 GPU 整卡：单个容器独享GPU。 GPU 虚拟化：容器需要使用的GPU百分比，例如设置为10%，表示该容器需使用GPU资源的10%。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸载您自建的Pro

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
使用Service实现简单的灰度发布和蓝绿发布 - 云容器引擎 CCE

如果10次访问中v1和v2版本比例并非4:1，可以将访问次数调整至更大，比如20。理论上来说，次数越多，v1与v2版本的响应比例将越接近于4:1。步骤3：实现蓝绿发布为部署的Deployment创建LoadBalancer类型的Service对外暴露服务，指定使用v1版本的服务。YAML示例如下：

帮助中心 > 云容器引擎 CCE > 最佳实践 > 发布
集群调度器配置 - 云容器引擎 CCE

集群调度器配置开启GPU共享是否开启GPU共享能力参数名取值范围默认值是否允许修改作用范围 enable-gpu-share true/false true 允许 CCE Standard/CCE Turbo 配置建议： true 默认调度器集群调度器选择开关，用户可自定义调度器模式。

帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
功能总览 - 云容器引擎 CCE
功能总览 - 云容器引擎 CCE

力，面向机器学习、深度学习、生物信息学、基因组学及其他大数据应用场景提供完整的应用调度特性。 CCE支持CPU资源调度、GPU/NPU异构资源调度、在离线作业混合部署、CPU Burst弹性限流等调度策略，您可以根据业务特征设置调度策略，帮助您提升应用的性能和集群整体资源的利用率。

帮助中心 > 云容器引擎 CCE > 功能总览

总条数： 280

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修改CCE集群配置 - 云容器引擎 CCE

Volcano调度器 - 云容器引擎 CCE

高性能调度 - 云容器引擎 CCE

设置节点亲和调度（nodeAffinity） - 云容器引擎 CCE

调度策略 - 云容器引擎 CCE

在CCE集群中部署使用Tensorflow - 云容器引擎 CCE

XGPU视图 - 云容器引擎 CCE

容器resource资源 - 云容器引擎 CCE

弹性伸缩概述 - 云容器引擎 CCE

Caffe分类范例 - 云容器引擎 CCE

NVIDIA Container Toolkit容器逃逸漏洞公告（CVE-2024-0132） - 云容器引擎 CCE

目标集群资源规划 - 云容器引擎 CCE

Volcano调度概述 - 云容器引擎 CCE

集群类型对比 - 云容器引擎 CCE

（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

创建普通任务（Job） - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

使用Service实现简单的灰度发布和蓝绿发布 - 云容器引擎 CCE

集群调度器配置 - 云容器引擎 CCE

功能总览 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线