检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
搜索告警规则 支持按规则名称等信息搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。 查看告警规则详细信息 单击规则名称前的,可查看该告警规则的详细信息,包括每个规则的基本信息、告警条件等。指标告警规则还可查看监控对象及触发的告警列表信息。
0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core CPU内核总量 该指标用于统计测量对象申请的CPU核总量。
直连接入:华为云主机,使用直连接入的方式。 直连接入 安装命令 安装UniAgent的命令,此处选择复制LINUX安装命令。 单击复制安装命令。
is_hw_cloud_host String 是否华为云机器。 vpc_id String VPC ID。 cmdb_id String CMDB ID。 ecs_id String ECS ID,唯一值。 domain_id String 机器所属domain ID。
搜索抑制规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 告警降噪
两者的区别在于统计对象不同。
选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在资源树上选择待监控的资源,设置完成,单击“确定”。 监控对象最多可添加100条指标数据。
该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。 表达式设置为“a/b”,最终计算结果即为主机的CPU内核占用率。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。
告警详情:在告警详情中查看告警对象的信息和修复建议,所有的告警都提供修复建议。 在事件列表中,有以下关键功能: 事件列表:支持按事件级别图形化查看事件信息。 高级过滤:支持在搜索框中按事件级别 、事件源、事件关键字等条件进行过滤,默认按照事件级别过滤。
搜索抑制规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 配置AOM告警降噪
Prometheus监控 当指标或事件满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 日志监控 当日志数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。
设置告警来源、触发对象和触发策略。 表1 告警规则填写说明 参数名称 填写说明 告警来源 事件类告警来源的服务名称,从现有的服务列表中选择。 触发对象 服务事件的筛选条件。从通知类型、事件名称、告警级别、自定义属性、命名空间、集群名称中选择一个或多个作为事件的过滤条件。
指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS.”开头,如表1所示。
基础设施监控:支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。
约束与限制 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。 创建快速分析 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志流”。 在“原始日志”页面单击“创建快速分析”按钮,如图1所示。
告警通知:通过创建通知规则关联接收对象与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联的接收对象与消息模板来发送告警通知。 告警降噪:在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
存储 对象存储服务OBS - 桶名称、区域、企业项目、区域、应用环境、操作。 云备份CBR - 名称/ID、资源状态、资源类型、计费模式、区域、企业项目、应用环境、操作。 函数工作流FunctionGraph - 函数 名称/ID、类型、区域、企业项目、应用环境、操作。
包含以下信息: 事件名称:根据“监控对象”设置的事件名称显示。如果在“监控对象”中未选择具体的事件名称,则此处显示为全部事件且不可选。 触发方式:事件类告警的触发方式。 累计触发:某个监控周期内,事件或者告警满足筛选条件的次数达到设置的累计次数,按照设置的频率发送对应的告警通知。