AI开发平台MODELARTS-如何使训练作业保持运行中状态:通过Sleep命令使训练作业保持运行

时间:2024-08-26 19:27:17

通过Sleep命令使训练作业保持运行

  • 如果训练作业使用的是预置框架:

    在创建训练作业时,“创建方式”选择“自定义算法”“启动方式”选择“预置框架”,代码目录中新增sleep.py并将此脚本作为“启动文件”。这样启动的作业将会持续运行60分钟。您可通过Cloud Shell进入容器进行调试。

    sleep.py示例:

    import os
    os.system('sleep 60m')
    图1 预置框架启动方式
  • 如果训练作业使用的是 自定义镜像

    在创建训练作业时,“创建方式”选择“自定义算法”“启动方式”选择“自定义”“启动命令”输入“sleep 60m”。这样启动的作业将会持续运行60分钟。您可通过Cloud Shell进入容器进行调试。

    图2 自定义启动方式
support.huaweicloud.com/develop-modelarts/develop-modelarts-0113.html