AI开发平台MODELARTS-不同机型的对应的软件配套版本:不同机型的对应的软件配套版本
不同机型的对应的软件配套版本
类型 |
卡类型 |
RDMA |
操作系统 |
适用范围、约束 |
依赖插件 |
---|---|---|---|---|---|
NPU |
ascend-snt9b |
roce |
|
|
插件版本匹配关系请见表3。 |
ascend-snt9b |
roce |
|
|
||
ascend-snt9 |
roce |
|
|
||
GPU |
ascend-ant8-pcie80 |
roce |
|
插件版本匹配关系请见表3。 |
|
nvidia-ant1 |
roce |
|
|||
nvidia-v100 |
roce|IB |
|
|||
|
类型 |
卡类型 |
操作系统 |
适用范围 |
依赖插件 |
---|---|---|---|---|
NPU |
ascend-snt3p-300i |
|
|
插件版本匹配关系请见表3。 |
ascend-snt3 |
|
|
||
|
||||
GPU |
nvidia-v100-pcie32 |
|
|
插件版本匹配关系请见表3。 |
nvidia-a30 |
|
|
||
ant1-pcie40 |
|
|
||
nvidia-t4 |
|
|
类别 |
插件名称 |
插件版本 |
适配CCE集群版本 |
适用范围、约束 |
插件功能描述 |
---|---|---|---|---|---|
ccePlugin |
gpu-beta |
1.2.29 |
v1.(23|25).* |
GPU |
支持在容器中使用GPU显卡的设备管理插件。 |
1.2.15 |
v1.(23|25).* |
||||
huawei-npu |
1.2.5 |
v1.(23|25).* |
NPU |
支持容器里使用huawei NPU设备的管理插件。 |
|
volcano |
1.11.9 |
v1.(23|25).* |
NPU |
基于Kubernetes的批处理平台。 |
|
1.7.1 |
v1.(23|25).* |
||||
1.4.2 |
v1.(23|25).* |
||||
npuDriver |
npu-driver |
6.4.0.2.220-23.0.rc2.2 6.4.0.3.220-23.0.rc2.3 6.4.0.4.220-23.0.rc3(推荐) 7.0.0.5.242-23.0.rc3 c78-21.0.2 c81-22.0.0.3 c82-22.0.2.100 c85-23.0.rc1 |
无约束 |
NPU |
用于升级、回滚npu驱动。 |
helm |
rdma-sriov-dev-plugin |
0.1.0 |
无约束 |
BMS、RDMA且非ascend-1980 |
用于支持容器里使用RDMA网卡。 |
memarts |
3.23.6-r002 |
无约束 |
无约束 |
无约束 |
|
os-node-agent |
6.2.0-20230925213538 |
无约束 |
无约束 |
OS插件,用于故障检测。 |
|
icAgent |
icagent |
default |
CCE默认安装当前适配版本 |
无约束 |
CCE基础组件,用于日志和监控。 |
gpuDriver |
gpu-driver |
gpu-driver与系统内核版本有关,请见表4。 |
用于升级、回滚gpu驱动,插件依赖gpu-beta版本。 |
镜像版本 |
系统内核版本 |
适配CCE |
gpu-driver版本 |
---|---|---|---|
EulerOS 2.10 |
4.18.0-147.5.2.15.h1109.eulerosv2r10.x86_64 |
v1.(23|25).* 容器隧道网络|VPC|ENI |
|
4.18.0-147.5.2.5.h805.eulerosv2r10.x86_64 |
v1.(23|25).* 容器隧道网络|VPC|ENI |
|
|
EulerOS 2.3 |
3.10.0-514.44.5.10.h193.x86_64 |
v1.(23|25).* 容器隧道网络|VPC |
|
3.10.0-514.44.5.10.h254.x86_64 |
v1.(23|25).* 容器隧道网络|VPC |
|
|
EulerOS 2.9 |
4.18.0-147.5.1.6.h841.eulerosv2r9.x86_64 |
v1.(23|25).* 容器隧道网络|VPC |
|