检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_cluster_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核数。 ≥0 核(Core) CPU使用率(aom_cluster_cpu_usage) 该指标用于统计测量对象的CPU使用率。
该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) aom_node_cpu_used_core CPU内核占用 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_node_cpu_usage CPU使用率 该指标用于统计测量对象的CPU使用率。
CPU内核总量(aom_process_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_process_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_process_cpu_usage)
该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) CPU使用率(aom_node_cpu_usage) 该指标用于统计测量对象的CPU使用率。
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
String 所属project ID。 version String UniAgent版本。 is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。
点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 用户最多可创建100条抑制规则。 创建抑制规则 在左侧导航栏中选择“告警 > 告警降噪”。 在“抑制规则”页签下单击
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
高级过滤:支持在搜索框中按告警级别 、告警源、告警关键字等条件进行过滤,默认按照告警级别过滤。 告警清除:支持单个、批量清除告警。 告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 在事件列表中,有以下关键功能: 事件列表:支持按事件级别图形化查看告警信息。 高级过滤:支持在搜索框中按事件级别
障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。 您最多可创建100条抑制规则,如果抑制规则数量已达上限100时,请删除不需要的抑制规则。 创建告警抑制规则
或者到组织追踪器配置的OBS桶中查看,也可以到组织追踪器配置的CTS/system日志流下面去查看。 用户通过云审计控制台只能查询最近7天的操作记录。如果需要查询超过7天的操作记录,您必须配置转储到对象存储服务(OBS)或云日志服务(LTS),才可在OBS桶或LTS日志组里面查看
息。 目前对于华北-北京一、华东-上海二和华南-广州区域,统计规则支持关键词统计和SQL统计。两者的区别在于统计对象不同。关键词统计的对象为原始日志;SQL统计的对象为结构化后的日志,且只有返回单个数值的SQL语句才能创建统计规则,例如select count(*) where code
设置告警规则的详细信息。 设置“规则类型”为“事件类告警”。 设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。从通知类型、事件名称、告警级别、自定义属性、命名空间
u_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。 选择监控对象时,如果开启了应用到所有开关,将会
设置此参数。 Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 日志监控 当日志数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 云监控 AOM 2.0控制台中创建监控数据来源为“云监控”类型的告警通知规则功能由云监控服务