检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
帮助用户快速分析应用健康状态。 应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明
AlarmParamForV4Db 参数 参数类型 描述 alarm_create_time Long 告警规则创建时间。 alarm_update_time Long 告警规则修改时间。 alarm_rule_name String 告警规则名称。 alarm_rule_id Long 告警规则id。
表示每次查询的日志条数不填时默认为5000,建议您设置为100。 第一次查询时使用pageSize 后续分页查询时使用size。 searchKey 是 SearchKey object 日志过滤条件集合,不同日志来源所需字段不同。 startTime 是 Long 搜索起始时间(UTC时间,毫秒级)。 type
Memory BW Utilization 表示在一个时间间隔内,向设备内存发送数据或者从设备内存接收数据的时间占比。 该值表示一个时间间隔内的平均值,而不是瞬时值。 较高的值表示设备内存的利用率较高。 该值为1(100%)表示在整个时间间隔内每个周期执行一次DRAM指令(实际上,约0
UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集,可在接入中心为插件创建采集任务,详情请参见虚机场景Exporter接入。 父主题: 采集设置
String 消息模板 最小长度:1 最大长度:100 create_time Long 创建时间 最小值:0 最大值:9999999999999 update_time Long 修改时间 最小值:0 最大值:9999999999999 time_zone String 时区 最小长度:1
String 消息模板 最小长度:1 最大长度:100 create_time Long 创建时间 最小值:0 最大值:9999999999999 update_time Long 修改时间 最小值:0 最大值:9999999999999 time_zone String 时区 最小长度:1
不是最新的。 图2 查看ICAgent的版本 节点的时间与实际不同步。 如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。
容等信息。 任务管理根据更新时间默认展示近7天的执行记录。可单击右上角“更新时间”的下拉框,选择展示执行记录的时间为“近1天”、“近7天”“近30天”或自定义时间段。 说明: 更新时间默认不展示在列表中,可通过单击列表右上角,勾选下拉框中的“更新时间”查看。 任务管理最多保存最近一年的执行记录。
containerPort: 9187 获取指标。 通过“curl http://exporter:9187/metrics”无法获取Postgres实例运行时间,可以通过自定义一个queries.yaml来获取该指标。 创建一个包含queries.yaml的配置。 将配置作为Volume挂载到Exporter某个目录下。
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
大长度为1024。 最小长度:0 最大长度:1024 create_time Long 创建时间 最小值:0 最大值:9999999999999 update_time Long 更新时间 最小值:0 最大值:9999999999999 resource_provider String
测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。 设置应用名称。 设置应用名称。 在“应用名称设置”下单击“添加命名项”,为已发现的进程设置应用名。 若您未设置应用名,则应用名默认为unknownapplicationname。 当
Long 消息通知模板创建时间。 desc String 消息通知模板描述。 enterprise_project_id String 消息通知模板所属企业项目id。 locale String 消息通知模板语言。 modify_time Long 消息通知模板修改时间。 name String
通知规则”,单击右上角的“创建通知规则”。 AOM已对接SMN,单击“创建主题”,在SMN界面设置通知策略。如果均已设置,请跳过该步骤。 创建一个主题,操作详见创建主题。 例如,创建名称为Topic1的主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败
自定义指标上报量即采样点数量,采样点数量计算方式遵循开源Prometheus的数据模型。一条采样点数据包含指标名称、Label集合、采样时间时间戳及取值这几个部分,采样点以时间线的方式在逻辑上组织起来。例如,kube_node_status_allocatable_cpu_cores指标监控了K
根源告警表示产生抑制的某类特定告警。 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警会被筛选出来,作为根源告警。
当主机的UniAgent状态为异常、安装失败或未安装时,您可以对主机进行重装UniAgent。 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏选择“采集设置 > UniAgent 安装与配置”。 勾选一个或多个待重装UniAgent服务器前的复选框,然后执行如下操作:
当主机的UniAgent状态为异常、安装失败或未安装时,您可以对主机进行重装UniAgent。 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏选择“采集设置 > UniAgent 安装与配置”。 勾选一个或多个待重装UniAgent服务器前的复选框,然后执行如下操作:
String 消息模板 最小长度:1 最大长度:100 create_time 否 Long 创建时间 最小值:0 最大值:9999999999999 update_time 否 Long 修改时间 最小值:0 最大值:9999999999999 time_zone 否 String 时区