搜索_华为云

CCE最佳实践汇总 - 云容器引擎 CCE

6-CCE Turbo集群容器网络走线介绍 CCE集群中容器出网总结 GPU&AI相关基于Nvidia xid进行GPU故障定位 CCE中GPU虚拟化的使用 Kubernetes场景下基于Nvidia GPU-operator实现图形渲染能力 Java应用容器化相关 Java业

 帮助中心 > 云容器引擎 CCE > 最佳实践
Kubeflow部署 - 云容器引擎 CCE
Kubeflow部署 - 云容器引擎 CCE

于容器和Kubernetes构建，旨在为数据科学家、机器学习工程师、系统运维人员提供面向机器学习业务的敏捷部署、开发、训练、发布和管理平台。它利用了云原生技术的优势，让用户更快速、方便地部署、使用和管理当前最流行的机器学习软件。目前Kubeflow 1.0版本已经发布，包含开发

 帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

主要特性： GPU支持V100类型集群支持权限管理 v1.11.7-r0 主要特性： Kubernetes同步社区1.11.7版本支持创建节点池（nodepool），虚拟机/鲲鹏ARM集群均支持 CCE集群支持创建裸金属节点（VPC网络），支持裸金属和虚机混合部署 GPU支持V100类型

 帮助中心 > 云容器引擎 CCE > 服务公告 > 产品发布记录 > 集群版本发布记录 > Kubernetes版本发布记录
（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

主要特性： GPU支持V100类型集群支持权限管理 v1.11.7-r0 主要特性： Kubernetes同步社区1.11.7版本支持创建节点池（nodepool），虚拟机/鲲鹏ARM集群均支持 CCE集群支持创建裸金属节点（VPC网络），支持裸金属和虚机混合部署 GPU支持V100类型

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 集群概述 > Kubernetes版本发布记录
创建普通任务（Job） - 云容器引擎 CCE

建议请参见设置容器规格。 GPU配额（可选）当集群中包含GPU节点时，才能设置GPU配额，且集群中需安装CCE AI套件（NVIDIA GPU）插件。不使用：表示不使用GPU。 GPU 整卡：单个容器独享GPU。 GPU 虚拟化：容器需要使用的GPU百分比，例如设置为10%，表示该容器需使用GPU资源的10%。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
创建守护进程集（DaemonSet） - 云容器引擎 CCE

建议请参见设置容器规格。 GPU配额（可选）当集群中包含GPU节点时，才能设置GPU配额，且集群中需安装CCE AI套件（NVIDIA GPU）插件。不使用：表示不使用GPU。 GPU 整卡：单个容器独享GPU。 GPU 虚拟化：容器需要使用的GPU百分比，例如设置为10%，表示该容器需使用GPU资源的10%。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
创建无状态负载（Deployment） - 云容器引擎 CCE

建议请参见设置容器规格。 GPU配额（可选）当集群中包含GPU节点时，才能设置GPU配额，且集群中需安装CCE AI套件（NVIDIA GPU）插件。不使用：表示不使用GPU。 GPU 整卡：单个容器独享GPU。 GPU 虚拟化：容器需要使用的GPU百分比，例如设置为10%，表示该容器需使用GPU资源的10%。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
创建有状态负载（StatefulSet） - 云容器引擎 CCE

建议请参见设置容器规格。 GPU配额（可选）当集群中包含GPU节点时，才能设置GPU配额，且集群中需安装CCE AI套件（NVIDIA GPU）插件。不使用：表示不使用GPU。 GPU 整卡：单个容器独享GPU。 GPU 虚拟化：容器需要使用的GPU百分比，例如设置为10%，表示该容器需使用GPU资源的10%。

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载 > 创建工作负载
Tensorflow训练 - 云容器引擎 CCE
Tensorflow训练 - 云容器引擎 CCE

kubectl delete -f tf-mnist.yaml 使用GPU训练 TFJob可在GPU场景下进行，该场景需要集群中包含GPU节点，并安装合适的驱动。在TFJob中指定GPU资源。创建tf-gpu.yaml文件，示例如下：该示例的主要功能是基于Tensorflo

帮助中心 > 云容器引擎 CCE > 最佳实践 > 批量计算 > 在CCE集群中部署使用Kubeflow
装箱调度（Binpack） - 云容器引擎 CCE

weight为CPU权重 Memory.score为Memory资源得分，Memory.weight为Memory权重 GPU.score为GPU资源得分，GPU.weight为GPU权重图1 Binpack策略示例如图所示，集群中存在两个节点，分别为Node 1和Node 2，在调度P

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
工作负载最佳实践 - 云容器引擎 CCE

在CCE中实现应用高可用部署升级实例过程中实现业务不中断通过特权容器功能优化内核参数使用Init容器初始化应用 CCE中使用x86和ARM双架构镜像使用SWR触发器自动更新工作负载版本插件高可用部署应用容器化改造工作负载参数配置实践容器网络带宽限制的配置建议使用hos

帮助中心 > 云容器引擎 CCE > 用户指南 > 工作负载
云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus 云原生监控插件兼容模式若您已自建Prometheus，且您的Prometheus基于开源，未做深度定制、未与您的监控系统深度整合，建议您卸载自建Prometheus并直接使用云原生监控插件对您的集群进行监控，无需开启“兼容模式”。卸载您自建的Pro

帮助中心 > 云容器引擎 CCE > 用户指南 > 云原生观测 > 云原生观测最佳实践
调度算法 - 云容器引擎 CCE
调度算法 - 云容器引擎 CCE

显的。虚拟GPU资源调度支持GPU虚拟化资源调度。参数名取值范围默认值是否允许修改作用范围 xGPU true/false true 允许 CCE Standard/CCE Turbo 支持GPU单卡算力、显存分割与隔离的调度能力配置建议：使用GPU的场景默认开启，不使用GPU资源可以选择关闭

 帮助中心 > 云容器引擎 CCE > 配置参考 > 集群
节点规格（flavor）说明 - 云容器引擎 CCE

e7、e6、e3 磁盘增强型 d7、d6、d6nl、d2、d3 超高I/O型 i7、i7n、i3、ir7、ir7n、ir3 高性能计算型 h3、hc2 GPU加速型 pi2、pi1 p2s、p2v、p2vs、p1 g6、g5、g6v AI加速型 ai1s、ai1 Flexus云服务器X x1、x1e

帮助中心 > 云容器引擎 CCE > API参考 > 附录
升级前检查异常问题排查 - 云容器引擎 CCE

Ingress控制器插件升级检查异常处理云原生监控插件升级检查异常处理 Containerd Pod重启风险检查异常处理 GPU插件关键参数检查异常处理 GPU/NPU Pod重建风险检查异常处理 ELB监听器访问控制配置项检查异常处理 Master节点规格检查异常处理 Master节点子网配额检查异常处理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 集群 > 升级集群
节点运行 - 云容器引擎 CCE
节点运行 - 云容器引擎 CCE

要有哪些？如何配置Pod使用GPU节点的加速能力？容器使用SCSI类型云硬盘偶现IO卡住如何解决？ docker审计日志量过大影响磁盘IO如何解决？ thinpool磁盘空间耗尽导致容器或节点异常时，如何解决？ CCE节点上监听的端口列表 GPU节点使用nvidia驱动启动容器排查思路

 帮助中心 > 云容器引擎 CCE > 常见问题 > 节点
调度配置 - 云容器引擎 CCE
调度配置 - 云容器引擎 CCE

异构资源调度（Volcano调度器支持）支持GPU资源调度使用该能力时，集群中需要同时安装CCE AI套件（NVIDIA GPU）。启用该能力后，可使用GPU资源运行AI训练作业，调度器提供GPU整卡调度和GPU共享调度能力，提高GPU资源利用率。支持NPU资源调度使用该能力时，集群中需要同时安装CCE

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
监控 - 云容器引擎 CCE
监控 - 云容器引擎 CCE

监控使用Prometheus监控多个集群使用dcgm-exporter监控GPU指标将Prometheus监控数据上报至第三方监控平台通过PromQL语句查询Prometheus数据

 帮助中心 > 云容器引擎 CCE > 最佳实践
调度 - 云容器引擎 CCE
调度 - 云容器引擎 CCE

调度调度概述 CPU调度 GPU调度 NPU调度 Volcano调度云原生混部

 帮助中心 > 云容器引擎 CCE > 用户指南
云原生异构计算插件 - 云容器引擎 CCE

云原生异构计算插件 CCE AI套件（NVIDIA GPU） CCE AI套件（Ascend NPU）父主题：插件

 帮助中心 > 云容器引擎 CCE > 用户指南 > 插件

总条数： 172

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CCE最佳实践汇总 - 云容器引擎 CCE

Kubeflow部署 - 云容器引擎 CCE

（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

（停止维护）Kubernetes 1.11版本说明 - 云容器引擎 CCE

创建普通任务（Job） - 云容器引擎 CCE

创建守护进程集（DaemonSet） - 云容器引擎 CCE

创建无状态负载（Deployment） - 云容器引擎 CCE

创建有状态负载（StatefulSet） - 云容器引擎 CCE

Tensorflow训练 - 云容器引擎 CCE

装箱调度（Binpack） - 云容器引擎 CCE

工作负载最佳实践 - 云容器引擎 CCE

云原生监控插件兼容自建Prometheus - 云容器引擎 CCE

调度算法 - 云容器引擎 CCE

节点规格（flavor）说明 - 云容器引擎 CCE

升级前检查异常问题排查 - 云容器引擎 CCE

节点运行 - 云容器引擎 CCE

调度配置 - 云容器引擎 CCE

监控 - 云容器引擎 CCE

调度 - 云容器引擎 CCE

云原生异构计算插件 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线