AI开发平台MODELARTS-训练容错检查:触发容错环境检测达到的效果

时间:2024-08-26 19:27:18

触发容错环境检测达到的效果

  • 容错检查正常通过时,会打印检测项目的日志,表示具体涉及的检查项目成功。您可以通过在日志中搜索“item”关键字查看。当容错检查正常通过时,可以减少运行故障上报问题。

  • 容错检查失败时,会打印检查失败的日志。您可以通过在日志中搜索“item”关键字查看失败信息。

    如果作业重启次数没有达到设定的次数,则会自动做重新下发作业。您可以通过搜索“error,exiting”关键字查找作业重启失败结束的日志。

support.huaweicloud.com/develop-modelarts/modelarts_trouble_0003.html