检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警规则(旧版) 添加阈值 父主题: 告警管理
告警规则(新版) 概述 标签和标注 创建阈值规则 创建静态阈值模板 创建事件类告警规则 父主题: 告警管理
方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围。 在过滤器上方的下拉列表中选择需要查看的应用。 单击事件卡片或列表进入该事件详情页面,查看事件的根因分析。 各异常事件的根因分析 应用
设置 OS账号 访问凭证 场景分类 父主题: 运维管理(日落)
采集器升级 登录AOM 1.0控制台。 在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“其他:用户自定义接入主机”。 选择主机后,单击“升级ICAgent”。 从下拉列表选择合适的AOM 2.0目标版本,单击“确定”。 ICAgent开始升级,
创建访问密钥成功后,您可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)。 请及时下载保存,弹窗关闭后将无法再次获取该密钥信息,但您可重新创建新的密钥。 当您下载访问密钥后,可以在浏览器页面左下角打开格式为.csv的访问密钥文件,或在浏览器“下载内容”中打开。 为
组规则。 所选择告警降噪的分组规则中配置的告警级别、标签等信息需与告警规则中的配置信息匹配,否则分组规则不生效。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建完成后,单击“返回告警规则列表”可查看已创建的告警规则。 当CCE服务的资源满足设置的事件告警条件时,在告警界
搜索框的筛选条件设置为“告警关健字”,然后输入关键字信息。 告警关健字:AOMRule,其中AOMRule为告警名称,即可查询出指定时间范围内告警名称为“AOMRule”的告警。 自定义属性 支持根据告警信息中的自定义属性进行精确查询。 搜索框的筛选条件设置为“自定义属性”,然
是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如,串行条件设置为“告警级别等于提示”,则符合告警级别为提示的告警通知会被屏蔽。 静默时间 告警通知被屏蔽的时间,包含以下两种: 固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
提供创建参数等功能,并展示现有所有参数信息。 作业管理 提供创建作业等功能,并支持对作业进行管理。 脚本管理 提供创建脚本等功能,并支持对脚本进行版本管理。 文件管理 提供创建文件包等功能,并支持对文件包进行版本管理。 设置 提供账号、访问凭证、场景分类管理功能。 工具市场 提供不同的原子服务场景,并且可以对各原子服务场景卡片进行上下架管理。
设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。 为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 创建阈值规则 登录AOM控制台,在左侧导航栏中选择“告警 > 阈值规则”,单击右上角的“添加阈值”。 自定义阈值规则。 选择资源
服务场景 服务场景概述 启动ECS实例 关闭ECS实例 重启RDS实例 修改ECS非管理员密码 重启CCE工作负载 清理磁盘空间 父主题: 运维管理(日落)
个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。 图1 通过柱状图查看统计数据 将鼠标移至矩形块,提示信息显示了该矩形块代表的时间范围(起
您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为1天。 查看调用链详情,详情请参见调用链。
告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能由字母、数字和下划线组成,且不能以下划线开头,您最多可创建10个自定义标签。 如果在创建告警规则
为了更好的采集体验,AOM会不断更新ICAgent版本。当Linux系统提示您有新的ICAgent版本时,您可以按照如下操作步骤进行升级。 登录AOM控制台,在左侧导航栏中选择“配置管理 > Agent管理”。 在页面右侧的下拉列表框中选择“集群:xxx”或“其他:用户自定义接入主机”。
务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。当资源的日志数据满足设置的告警条件,产生日志告警。
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
的上报不产生费用。 产生计费的可能原因是: Prometheus实例内置的指标管理功能采集到自定义指标并上报指标到AOM。 表1 内置ServiceMonitor配置费用说明 ServiceMonitor 是否导致费用 默认状态(关闭表示不会采集自定义指标) etcd-server
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理