AI开发平台ModelArts-使用自定义镜像创建训练作业,找不到启动文件:处理方法
处理方法
需要排查执行命令的启动文件目录是否正确,具体操作如下:
在ModelArts管理控制台,使用训练的 自定义镜像 创建训练作业时,“算法来源”选择“自定义”页签。
若训练代码启动脚本在OBS路径为“obs://bucket-name/app/code/train.py”,创建作业时配置代码目录为“/bucket-name/app/code/”。
代码目录配置完成后,执行如下命令,那么“run_train.sh”将选中的“code”文件夹下载到旧版训练容器的“/home/work/user-job-dir”目录中。
bash /home/work/run_train.sh #旧版训练命令,run_train.sh训练启动引导脚本,打包在ModelArts提供的基础镜像中。
运行命令就可以设置为:
bash /home/work/run_train.sh python /home/work/user-job-dir/code/train.py {python_file_parameter} #旧版训练
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts自定义镜像_自定义镜像简介_如何使用自定义镜像
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts分布式训练_分布式训练介绍_分布式调测
- ModelArts推理部署_创建AI应用_自定义镜像规范-华为云
- 容器镜像创建用户并授权使用SWR_华为云SWR_容器镜像创建授权
- ModelArts计费说明_计费简介_ModelArts怎么计费
- ModelArts开发环境_开发环境简介_开发环境怎么使用
- ModelArts模型训练_超参搜索简介_超参搜索算法
- 什么是媒体处理_媒体处理功能特性_媒体处理使用