正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 AOM提供告警规则设置功能。通过告警规则可对服务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件
本文介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus 监控。具体操作请参见: Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例
主机ICAgent安装失败,请登录服务器卸载后重新安装。 升级中 正在为主机升级ICAgent,升级ICAgent预计需要1分钟左右,请耐心等待。 升级失败 主机ICAgent升级失败,请登录服务器卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。
AOM使用流程如下图所示。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 购买云主机(必选) 安装ICAgent(必选) ICAgent是AOM的采集器,用于实时采集指标、日志和应用性能数据。 如果是通过CCE购买的云主机,购买后自动安装ICAgent。 配置应用发现规则(可选)
"group" : "ecs_instance", "ecs_id_list" : "[\"xxx\"]", "ecs_instance_status" : null, "ecs_instance_tags" : null, "ecs_inst
络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入ECS类型Prometheus监控,具体请参见Prometheus实例 for ECS。 服务已接入云服务类型Prometheus监控,具体请参见Prometheus实例 for 云服务。
新增Prometheus实例 功能介绍 该接口用于新增Prometheus实例。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
选框,在弹出框中单击“启用”或“停用”。 批量设置告警通知 选中一个或多个同类型告警规则前的复选框,在弹出框中单击“告警通知”,即可为选中的告警规则批量设置告警通知策略。根据告警规则类型的不同,具体操作请参见设置告警通知策略1或设置告警通知策略2。 搜索告警规则 支持按规则名称等
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 SAP 监控 随着越来
需要提前在组件设置中配置组件与基础设施关联分析设置后,页面才会展示基础设施页签。 图1 查看基础设施 在下拉列表中选择您想要查看的APM实例,可以查看该实例下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
统计周期为“1分钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图10 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息。 设置告警通知策略。告警通知策略有两种
关闭ECS实例 使用关闭ECS实例卡片可以创建任务,用来关闭一个或多个ECS实例。 创建关闭ECS实例任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“服务场景”,在服务场景页面单击“关闭ECS实例”卡片,
查询日志 功能介绍 该接口用于查询不同维度(例如集群、IP、应用等)下的日志内容,支持分页查询。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/als/action 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击列表右
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" }, "annotations" : {
在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 资源列表仅展示与应用企业项目相同的资源。 设置完成后,单击“关联”。 如果关联的资源为云服务器ECS资源,需
资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK
配置指标 介绍如何查看CCE类型、ECS类型、云服务类型、通用实例与default类型Prometheus实例的指标以及新增指标和废弃指标。 前提条件 服务已接入CCE类型Prometheus 监控并接入CCE集群,具体请参见Prometheus实例 for CCE。 服务已接入云服务类型Prometheus
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您