AI开发平台MODELARTS-示例:创建DDP分布式训练(PyTorch+NPU):创建训练作业
创建训练作业
本案例创建训练作业时,需要配置如下参数。
参数名称 |
说明 |
---|---|
“创建方式” |
选择“自定义算法”。 |
“启动方式” |
选择“自定义”。 |
“镜像” |
选择用于训练的 自定义镜像 。 |
“代码目录” |
执行本次训练作业所需的代码目录。本文示例的代码目录为“obs://test-modelarts/ascend/code/”。 |
“启动命令” |
镜像的Python启动命令。本文示例的启动命令为“bash ${MA_JOB_DIR}/code/run_torch_ddp_npu.sh”。其中,启动脚本的完整代码请参见代码示例。 |
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts分布式训练_分布式训练介绍_分布式调测
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts模型训练_超参搜索简介_超参搜索算法
- ModelArts计费说明_计费简介_ModelArts怎么计费
- ModelArts自定义镜像_自定义镜像简介_如何使用自定义镜像
- 分布式云原生集合示例_华为云分布式云原生_华为云UCS集合示例
- 华为云ModelArts_ModelArts开发_AI全流程开发
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云
- ModelArts开发环境_开发环境简介_开发环境怎么使用