AI开发平台MODELARTS-在ModelArts Standard上运行GPU多机多卡训练作业:操作流程

时间:2025-01-09 16:29:09

操作流程

  1. 准备工作:
    1. 购买服务资源(VPC/SFS/OBS/SWR/E CS
    2. 配置权限
    3. 创建专属资源池(打通VPC)
    4. ECS服务器挂载SFS Turbo存储
    5. 在ECS中设置ModelArts用户可读权限
    6. 安装和配置OBS命令行工具
    7. (可选)工作空间配置
  2. 模型训练:
    1. 线下容器镜像构建及调试
    2. 上传镜像
    3. 上传数据至OBS(首次使用时需要)
    4. 上传算法至SFS
    5. 使用Notebook进行代码调试
    6. 创建多机多卡训练作业
support.huaweicloud.com/bestpractice-modelarts/modelarts_20_2040.html