AI开发平台ModelArts-不同机型的对应的软件配套版本:驱动和插件版本与CCE集群版本适配关系

时间:2025-02-12 15:01:42

驱动和插件版本与CCE集群版本适配关系

表3 插件版本与CCE集群版本适配关系

类别

插件名称

插件版本

适配CCE集群版本

适用范围、约束

插件功能描述

npuDriver

npu-driver

7.1.0.9.220-23.0.6(推荐)

7.1.0.7.220-23.0.5

7.1.0.5.220-23.0.3

无约束

NPU

用于升级、回滚npu驱动

gpuDriver

gpu-driver

515.65.01(推荐)

510.47.03

470.182.03

470.57.02

无约束

GPU

用于升级、回滚gpu驱动,插件依赖gpu-beta版本

ccePlugin

gpu-beta

2.6.4(推荐)

v1.28.*

GPU

支持在容器中使用GPU显卡的设备管理插件

2.0.48

v1.(23|25).*

huawei-npu

2.1.22(推荐)

v1.(23|25|28).*

NPU

支持容器里使用huawei NPU设备的管理插件

volcano

1.15.8(推荐)

v1.(23|25|28).*

NPU

基于Kubernetes的批处理平台

helm

rdma-sriov-dev-plugin

0.1.0

无约束

适用于BMSRDMA且非ascend-1980

用于支持容器里使用RDMA网卡。

os-node-agent

6.5.0-20240529142433

无约束

无约束

OS插件,用于故障检测。

icAgent

icagent

default

CCE默认安装当前适配版本

无约束

CCE基础组件,用于日志和监控。

support.huaweicloud.com/usermanual-cluster-modelarts/umn-cluster-modelarts-0004.html