AI开发平台MODELARTS-查看训练作业资源占用情况:如何判断训练作业资源利用率高低

时间:2024-12-28 10:03:44

如何判断训练作业资源利用率高低

在模型训练的训练作业列表页可以查看作业资源利用率情况。当作业worker-0实例的GPU/NPU的平均利用率低于50%时,在训练作业列表中会进行告警提示。

图2 作业列表显示作业资源利用率情况

此处的作业资源利用率只涉及GPU和NPU资源。作业worker-0实例的GPU/NPU平均利用率计算方法:将作业worker-0实例的各个GPU/NPU加速卡每个时间点的利用率汇总取平均值。

support.huaweicloud.com/usermanual-standard-modelarts/develop-modelarts-0015.html