AI开发平台MODELARTS-查看训练作业监控指标:支持在ModelArts控制台上直接查看的监控指标

时间:2025-03-04 20:53:08

支持在ModelArts控制台上直接查看的监控指标

支持在ModelArts的控制台上直接查看的训练监控指标如表1表2所示。

表1 单个训练作业指标说明

指标

说明

查看方式

cpuUsage

单个训练作业CPU使用率。

在ModelArts控制台的训练作业详情页中查看。

具体操作及约束限制请参见查看训练作业资源占用情况章节。

gpuMemUsage

单个训练作业GPU内存使用率。

gpuUtil

单个训练作业GPU使用情况。

memUsage

单个训练作业内存使用率。

npuMemUsage

单个训练作业NPU内存使用率。

npuUtil

单个训练作业NPU使用情况。

表2 训练作业任务级的指标说明

指标

说明

查看方式

训练作业资源利用率

每个训练作业的CPU、GPU或NPU资源利用率。

在ModelArts控制台总览页的“训练作业资源利用情况”版块查看。

卡时

每个训练作业运行时长和占用卡数。

在ModelArts控制台总览页的“训练作业资源利用情况”版块查看。

support.huaweicloud.com/usermanual-standard-modelarts/develop-modelarts-1424.html