AI开发平台MODELARTS-Lite Cluster资源配置流程:配置流程

时间:2024-09-27 17:17:21

配置流程

图1 Lite Cluster资源配置流程图
表1 Cluster资源配置流程

配置顺序

配置任务

场景说明

1

配置Lite Cluster网络

购买资源池后,需要弹性公网IP并进行网络配置,配置网络后可通过公网访问集群资源。

2

配置kubectl工具

kubectl是Kubernetes集群的命令行工具,配置kubectl后,您可通过kubectl命令操作Kubernetes集群。

3

配置Lite Cluster存储

如果没有挂载任何外部存储,此时可用存储空间根据dockerBaseSize的配置来决定,可访问的存储空间比较小,因此建议通过挂载外部存储空间解决存储空间受限问题。容器中挂载存储有多种方式,不同的场景下推荐的存储方式不一样,您可根据业务实际情进行选择。

4

(可选)配置驱动

当专属资源池中的节点含有GPU/Ascend资源时,为确保GPU/Ascend资源能够正常使用,需要配置好对应的驱动。如果在购买资源池时,没配置自定义驱动,默认驱动不满足业务要求,可通过本章节将驱动升级到指定版本。

5

(可选)配置镜像预热

Lite Cluster资源池支持镜像预热功能,镜像预热可实现将镜像提前在资源池节点上拉取好,在推理及大规模分布式训练时有效缩短镜像拉取时间。

support.huaweicloud.com/usermanual-cluster-modelarts/umn-cluster-modelarts-0007.html