检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
个/秒(Count/s) 容器错包个数(aom_container_network_rx_error_packets) 该指标用于统计测量对象收到错误包的数量。 ≥0 个(Count) 上行Bps(aom_container_network_transmit_bytes) 该指标用于统计测试对象的出方向网络流速。
取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合
取值范围:0s-10min,推荐设置为 15s。 变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。 此处的变化是指新增告警或告警状态改变。 取值范围:5s-30min,推荐设置为60s。 重复等待 合并集合
阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至告警条件上方的图表区,会浮动显示当前指标的ID、IP、单位等信息。 告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复
阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至告警条件上方的图表区,会浮动显示当前指标的ID、IP、单位等信息。 告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复
云监控服务(Cloud Eye)为您提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 AOM通过调用云监控服务的接口来获取各种云服务监控数据,并展现在AOM界面,以便在AOM界面统一对这些服务进行监控。
gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0
条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将
源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那么AOM将自动将T
源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那么AOM将自动将T
条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将