检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
时 不填。 “0”:只告警一次 “300”:每5分钟 “600”:每10分钟: “900”:每15分钟: “1800”:每30分钟: “3600”:每1小时: “10800”:每3小时: “21600”:每6小时: “43200”:每12小时: “86400”:每天: 表15 AlarmNotification
支持配置分词,通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。了解详情 2018-10-24 支持创建统计规则,通过统计规则能够周期性统计关键字在日志文件中出现的条数,并生成指标数据。了解详情 2018-9-26 支持日志转储,可将日志桶中的日志文件转储到OBS桶中。了解详情
修改告警行动规则 √ x 删除告警行动规则 √ x 创建消息模板 √ x 修改消息模板 √ x 删除消息模板 √ x 创建分组规则 √ x 修改分组规则 √ x 删除分组规则 √ x 创建抑制规则 √ x 修改抑制规则 √ x 删除抑制规则 √ x 创建静默规则 √ x 修改静默规则 √
ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core
进行筛选,以便将满足条件的日志进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group1 转储周期 对1天的日志以转储周期为粒度进行分割,将每天
概述 AOM提供告警规则设置功能。通过告警规则可对服务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件
再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。 图1 告警降噪流程图
日志管理 AOM提供强大的日志管理能力。日志检索功能可帮您快速在海量日志中查询到所需的日志;日志转储帮您实现长期存储;通过创建日志统计规则实现关键词周期性统计,并生成指标数据,实时了解系统性能及业务等信息;通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。
设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。 告警故障已经解除时可进行清除操作。
行转储。 日志采集时间选择30分钟,组件选择als0320a,关键词设置为warn。 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group2 目标OBS桶 存储日志的OBS桶。 说明: 如果没有创
告警降噪:对告警信息自动匹配告警降噪分组规则后再发送告警,防止产生告警风暴。 从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可在下拉列表中单击“新建分组规则”添加,具体操作请参见创建分组规则。 所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。
形式展示近30分钟的所有事件。您可以根据需要调整时间范围,查看近1小时、近6小时、近1天、近1周或自定义时间段的事件。 图2 事件统计视图 在事件统计图区域,还可以执行以下操作: 在图表左上角,查看设置的时间段内事件巡检检测到的异常事件总数。 将鼠标悬浮于柱状图上,查看对应时间点各类型的事件数量。
动规则关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。告警行动规则创建成功后,可在“告警管理 > 告警降噪 > 分组规则”中“创建分组规则”关联行动规则。 创建告警行动规则 创建消息模板 父主题: 告警行动规则
设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的事件。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
node_network_up 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最
aom_container_cpu_usage 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。此处根据3中监控的工作负载设置条件。 集群名称=aom-doc-test AND 工作负载名称=coredns 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。
ercent) 该指标用于统计CCE节点上thinpool元数据空间使用百分比。 0~100 百分比(%) Thin pool 数据空间使用率 (aom_host_diskpartition_thinpool_data_percent) 该指标用于统计CCE节点上thinpool数据空间使用百分比。
输入关键词:单击文本框,文本框下面显示了该桶下的所有统计规则及其关键词,可直接单击进行选择,选择后统计规则的关键词会自动输入到文本框中;也可直接在文本框中手动输入关键词。 对于常用的、复杂的关键词,可单击,创建统计规则。在后续查询时,不用再在文本框中手动输入,直接单击文本框,选择对应的统计规则及其关键词,即可自
node_network_up 统计周期 指标数据按照所设置的统计周期进行聚合。 1分钟 条件 指标监控的维度。不设置则表示选中全部资源。本示例可不填写。 - 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。 不分组 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最
关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制 快速分析的对象为结构化日志中提取的关键字段,创建快速分析前请先对原始日志进行结构化配置。