检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”以上的监控时长系统默认显示聚合指标数据。您可以选择是否开启“自动刷新”功能,云监控服务提供了“30秒”自动刷新周期。 在监控指标视图右上角,单击可查看监控指标视图详情。 页面左上方提供
GPU存在infoROM告警 gpuInfoROMAlarm 重要 GPU可能存在硬件问题,导致驱动读取不到inforom信息。 业务可以继续使用该GPU卡,不敏感业务可以继续使用,敏感业务请提交工单处理。 对业务暂时没有影响,当GPU硬件出现ECC故障时,可能无法自动完成故障页隔离,导致业务受损。
GPU存在infoROM告警 gpuInfoROMAlarm 重要 GPU可能存在硬件问题,导致驱动读取不到inforom信息。 业务可以继续使用该GPU卡,不敏感业务可以继续使用,敏感业务请提交工单处理。 对业务暂时没有影响,当GPU硬件出现ECC故障时,可能无法自动完成故障页隔离,导致业务受损。
如果有连续三次退出记录,则休眠20分钟,休眠期间,不会采集监控数据。 当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。
创建通知组参数说明 参数 参数说明 组名称 通知组名称,长度不得超过64个字符。 归属企业项目 通知组所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警通知组。创建企业项目请参考:创建企业项目。 通知对象 选择已添加的通知对象。 每次最多添加10个通知对象。 使用语音协议时