AI开发平台MODELARTS-使用自定义镜像创建训练作业找不到启动文件:处理方法
处理方法
需要排查执行命令的启动文件目录是否正确,具体操作如下:
在ModelArts管理控制台,使用训练的 自定义镜像 创建训练作业时,“创建方式”选择“自定义算法”,“启动方式”选择“自定义”。
例如,当训练代码启动脚本在OBS路径为“obs://bucket-name/app/code/train.py”,创建作业时配置代码目录为“/bucket-name/app/code/”。则代码目录配置完成后,执行如下命令,那么“run_train.sh”将选中的“code”文件夹下载到训练容器的“/home/ma-user/modelarts/user-job-dir”目录中。
bash /home/ma-user/modelarts/user-job-dir/run_train.sh #训练自定义镜像-预置命令场景
运行命令就可以设置为:
bash /home/ma-user/modelarts/user-job-dir/run_train.sh python /home/ma-user/modelarts/user-job-dir/code/train.py {python_file_parameter} #训练自定义镜像-预置命令场景
- ModelArts模型训练_模型训练简介_如何训练模型
- ModelArts自定义镜像_自定义镜像简介_如何使用自定义镜像
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts分布式训练_分布式训练介绍_分布式调测
- ModelArts推理部署_创建AI应用_自定义镜像规范-华为云
- 容器镜像创建用户并授权使用SWR_华为云SWR_容器镜像创建授权
- ModelArts开发环境_开发环境简介_开发环境怎么使用
- ModelArts模型训练_超参搜索简介_超参搜索算法
- 什么是媒体处理_媒体处理功能特性_媒体处理使用
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云