搜索_华为云

GPU调度 - 云容器引擎 CCE
GPU调度 - 云容器引擎 CCE

GPU调度 GPU节点驱动版本使用Kubernetes默认GPU调度 GPU虚拟化监控GPU资源指标 CCE AI套件（NVIDIA GPU）插件使用DCGM-Exporter监控GPU指标基于GPU监控指标的工作负载弹性伸缩配置 GPU虚拟化节点弹性伸缩配置 GPU故障处理

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
调度 - 云容器引擎 CCE
调度 - 云容器引擎 CCE

调度调度概述 CPU调度 GPU调度 NPU调度 Volcano调度云原生混部

 帮助中心 > 云容器引擎 CCE > 用户指南
资源利用率优化调度 - 云容器引擎 CCE

资源利用率优化调度装箱调度（Binpack）重调度（Descheduler）节点池亲和性调度负载感知调度资源利用率优化调度配置案例父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
资源利用率优化调度配置案例 - 云容器引擎 CCE

逐重新调度的场景中，通过负载感知和热点打散重调度结合使用，可以获得集群最佳的负载均衡效果。关于热点打散重调度能力的使用请参见重调度（Descheduler）。开启负载感知调度策略，使用默认权重值5。插件详情与配置方法请参见负载感知调度。开启重调度能力，完成负载感知重调度策略配

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度 > 资源利用率优化调度
AI任务性能增强调度 - 云容器引擎 CCE

AI任务性能增强调度公平调度（DRF）组调度（Gang）父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
业务优先级保障调度 - 云容器引擎 CCE

业务优先级保障调度优先级调度与抢占父主题： Volcano调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

使用GPU虚拟化兼容Kubernetes默认GPU调度模式，要求配套的CCE AI 套件 (NVIDIA GPU)插件版本为2.0.10及以上、Volcano调度器插件版本为1.10.5及以上。兼容Kubernetes默认GPU调度模式示例使用kubectl连接集群。创建一个使用nvidia

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
Pod的编排与调度 - 云容器引擎 CCE

Pod的编排与调度无状态负载（Deployment）有状态负载（StatefulSet）普通任务（Job）和定时任务（CronJob）守护进程集（DaemonSet）亲和与反亲和调度

 帮助中心 > 云容器引擎 CCE > Kubernetes基础知识
GPU监控指标说明 - 云容器引擎 CCE

GPU）插件提供GPU监控指标，并集成了DCGM-Exporter组件（要求插件版本2.7.32+），引入更丰富的GPU可观测性场景。本文介绍CCE AI套件（NVIDIA GPU）插件指标的详细信息。计费说明 GPU指标作为自定义指标，如果将该指标上报至AOM，将进行按需收费

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
CPU管理策略 - 云容器引擎 CCE
CPU管理策略 - 云容器引擎 CCE

Init Containers CPUs - CPU Manager Static Policy。在使用时您可以利用节点亲和调度将如上配置的Pod调度到开启静态（static）CPU管理策略的节点上，这样就能够达到独占CPU的效果。设置独占CPU的YAML示例如下： kind:

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > CPU调度
监控GPU资源指标 - 云容器引擎 CCE

监控GPU资源指标通过Prometheus和Grafana，可以实现对GPU资源指标的观测。本文以实际示例介绍如何通过Prometheus查看集群的GPU显存的使用。本文将通过一个示例应用演示如何监控GPU资源指标，具体步骤如下：访问Prometheus （可选）为Prom

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
CPU调度 - 云容器引擎 CCE
CPU调度 - 云容器引擎 CCE

CPU调度 CPU管理策略增强型CPU管理策略父主题：调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度
应用扩缩容优先级策略 - 云容器引擎 CCE

级进行调度。但由于调度器会从多个维度对调度结果进行考虑，本优先级策略只是其中一个维度，因此无法百分百确保完全实现上述优先级。 Volcano调度器存在调度性能和调度结果之间的权衡。当集群存在大量可调度节点时，Volcano出于调度性能的考虑会只选择其中一部分节点来进行调度选择，不

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > Volcano调度
增强型CPU管理策略 - 云容器引擎 CCE

增强型CPU管理策略在Kubernetes默认提供的CPU管理策略中有none和static两种： none：默认不开启CPU管理策略，表示现有的调度行为。 static：开启静态绑核的CPU管理策略，允许为节点上具有某些资源特征的 Pod（Guaranteed pod）赋予增强的 CPU

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > CPU调度
调度配置 - 云容器引擎 CCE
调度配置 - 云容器引擎 CCE

资源利用率优化调度（Volcano调度器支持） AI任务性能增强调度（Volcano调度器支持）异构资源调度（Volcano调度器支持） Volcano调度器（v1.27及以上版本支持）设置Volcano调度器为默认调度器后，Volcano调度器将替换kube-schedul

帮助中心 > 云容器引擎 CCE > 用户指南 > 配置中心
准备GPU虚拟化资源 - 云容器引擎 CCE

步骤三（可选）：修改Volcano调度策略 Volcano针对GPU节点的调度策略默认为Spread，即如果节点配置相同，会选择一个正在运行的容器数量最少的节点，可以尽量将容器平均分配到各个节点。而Binpack调度策略与之相反，它会尽可能地把所有的容器调度到一台节点上运行，尽量少用节点，避免资源碎片化。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
使用GPU虚拟化 - 云容器引擎 CCE

现无法调度状况。算力：算力值单位为%，需为5的倍数，且最大不超过100。当显存设置为单张GPU卡的容量上限或算力设置为100%时，将会使用整张GPU卡。使用GPU虚拟化时，工作负载调度器将默认指定为Volcano且不可更改。图1 设置xGPU配额本文主要为您介绍GPU虚

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化
工作负载异常：实例调度失败 - 云容器引擎 CCE

工作负载异常：实例调度失败问题定位当Pod状态为“Pending”，事件中出现“实例调度失败”的信息时，可根据具体事件信息确定具体问题原因。事件查看方法请参见工作负载状态异常定位方法。排查思路根据具体事件信息确定具体问题原因，如表1所示。表1 实例调度失败事件信息问题原因与解决方案

 帮助中心 > 云容器引擎 CCE > 常见问题 > 工作负载 > 工作负载异常问题排查
GPU虚拟化 - 云容器引擎 CCE
GPU虚拟化 - 云容器引擎 CCE

GPU虚拟化 GPU虚拟化概述准备GPU虚拟化资源使用GPU虚拟化兼容Kubernetes默认GPU调度模式父主题： GPU调度

 帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度
GPU虚拟化概述 - 云容器引擎 CCE

02、510.47.03、535.54.03版本的GPU驱动。运行时仅支持containerd 插件集群中需要同时安装以下插件： Volcano调度器插件：1.10.5及以上版本 CCE AI套件（NVIDIA GPU）插件：2.0.5及以上版本约束与限制单个GPU卡最多虚拟化成20个GPU虚拟设备。

帮助中心 > 云容器引擎 CCE > 用户指南 > 调度 > GPU调度 > GPU虚拟化

总条数： 794

上一页
1
2
3
4
5
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU调度 - 云容器引擎 CCE

调度 - 云容器引擎 CCE

资源利用率优化调度 - 云容器引擎 CCE

资源利用率优化调度配置案例 - 云容器引擎 CCE

AI任务性能增强调度 - 云容器引擎 CCE

业务优先级保障调度 - 云容器引擎 CCE

兼容Kubernetes默认GPU调度模式 - 云容器引擎 CCE

Pod的编排与调度 - 云容器引擎 CCE

GPU监控指标说明 - 云容器引擎 CCE

CPU管理策略 - 云容器引擎 CCE

监控GPU资源指标 - 云容器引擎 CCE

CPU调度 - 云容器引擎 CCE

应用扩缩容优先级策略 - 云容器引擎 CCE

增强型CPU管理策略 - 云容器引擎 CCE

调度配置 - 云容器引擎 CCE

准备GPU虚拟化资源 - 云容器引擎 CCE

使用GPU虚拟化 - 云容器引擎 CCE

工作负载异常：实例调度失败 - 云容器引擎 CCE

GPU虚拟化 - 云容器引擎 CCE

GPU虚拟化概述 - 云容器引擎 CCE

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线