AI开发平台MODELARTS-不同机型的对应的软件配套版本:插件版本与CCE集群版本适配关系

时间:2024-06-26 17:55:04

插件版本与CCE集群版本适配关系

表3 插件版本与CCE集群版本适配关系

类别

插件名称

插件版本

适配CCE集群版本

适用范围、约束

插件功能描述

ccePlugin

gpu-beta

2.0.48(仅适用于北京四、贵阳一、广州一、上海一、乌兰察布一、北京二、乌兰察布汽车,其余region暂不支持。)

v1.(23|25).*

GPU

支持在容器中使用GPU显卡的设备管理插件。

1.2.15

v1.23.*

huawei-npu

1.2.5

v1.(23|25).*

NPU

支持容器里使用huawei NPU设备的管理插件。

volcano

1.11.9

v1.(23|25).*

NPU

基于Kubernetes的批处理平台。

1.7.1

v1.(23|25).*

1.4.2

v1.(23|25).*

npuDriver

npu-driver

7.1.0.7.220-23.0.5(推荐)

无约束

NPU

用于升级、回滚npu驱动。

helm

rdma-sriov-dev-plugin

0.1.0

无约束

BMS、RDMA且非ascend-1980

用于支持容器里使用RDMA网卡。

memarts

3.23.6-r002

无约束

无约束

近计算侧分布式缓存插件,用于存储加速。

os-node-agent

6.2.0-20230925213538

无约束

无约束

OS插件,用于故障检测。

icAgent

icagent

default

CCE默认安装当前适配版本

无约束

CCE基础组件,用于日志和监控。

gpuDriver

gpu-driver

gpu-driver与系统内核版本有关,请见表4

用于升级、回滚gpu驱动,插件依赖gpu-beta版本。

support.huaweicloud.com/usermanual-modelarts-lite/usermanual-modelarts-lite-0338.html