AI开发平台MODELARTS-设置条件自动重启:开启无条件自动重启
开启无条件自动重启
开启无条件自动重启有2种方式:控制台设置或API接口设置。
- 控制台设置
在创建训练作业页面,开启“自动重启”开关,并勾选“无条件自动重启”,开启无条件自动重启。开启无条件自动重启后,只要系统检测到训练异常,就无条件重启训练作业。如果未勾选“无条件自动重启”只是打开了“自动重启”开关,则表示仅环境问题导致训练作业异常时才会自动重启,其他问题导致训练作业异常时会直接返回“运行失败”。
图1 开启无条件重启
- API接口设置
通过API接口创建训练作业时,在“metadata”字段的“annotations”中传入“fault-tolerance/job-retry-num”和“fault-tolerance/job-unconditional-retry”字段。“fault-tolerance/job-retry-num”赋值为1~128表示开启自动重启,“fault-tolerance/job-unconditional-retry”赋值为“true”表示启用了无条件自动重启。
{ "kind": "job", "metadata": { "annotations": { "fault-tolerance/job-retry-num": "8", "fault-tolerance/job-unconditional-retry": "true" } } }
- GaussDB(for MySQL)重点特性介绍_升级Proxy内核版本_重启Proxy实例
- ModelArts自动学习是什么_自动学习简介_零代码完成AI开发
- GaussDB数据库备份与恢复_华为高斯数据库_新建高斯数据库_高斯语法
- 主机加固_主机加固是什么意思_主机安全加固
- RPA自动化_财务RPA_RPA操作
- RPA流程自动化_RPA 产品_RPA证书
- 云数据库RDS for MySQL存储空间自动扩容_存储空间_自动扩容_MySQL云盘
- 云数据库 RDS for MySQL版本升级_MySQL如何进行版本升级_华为云
- 便宜又好用的云手机_云手机免费版_搭建云手机
- OA全称_OA邮箱登陆_OA自动化