AI开发平台MODELARTS-在ModelArts Standard上运行GPU单机单卡训练任务:监控资源

时间:2024-11-15 09:44:20

监控资源

用户可以通过资源占用情况窗口查看计算节点的资源使用情况,最多可显示最近三天的数据。在资源占用情况窗口打开时,会定期向后台获取最新的资源使用率数据并刷新。

操作一:如果训练作业使用多个计算节点,可以通过实例名称的下拉框切换节点。

操作二:单击图例“cpuUsage”“gpuMemUsage”“gpuUtil”“memUsage”“npuMemUsage”“npuUtil”、可以添加或取消对应参数的使用情况图。

操作三:鼠标悬浮在图片上的时间节点,可查看对应时间节点的占用率情况。

表2 参数说明

参数

说明

cpuUsage

cpu使用率。

gpuMemUsage

gpu内存使用率。

gpuUtil

gpu使用情况。

memUsage

内存使用率。

npuMemUsage

npu内存使用率。

npuUtil

npu使用情况。

support.huaweicloud.com/bestpractice-modelarts/modelarts_20_2034.html