检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置多账号聚合实现指标统一监控 多账号聚合Prometheus实例类型,提供对同一组织下多个成员账号的云服务指标监控。 前提条件 已在组织控制台界面启用AOM 可信服务,具体操作请参见启用、禁用可信服务。 同一组织下多个成员账号均已接入云服务指标。 约束与限制 只有组织管理员或委
配置数据多写实现监控指标转储到自建Prometheus 通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息,以更加安全、可靠的方式将监控数据上报到自建Prometheus中。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
Service,简称RFS)通过图形化设计器,直观便捷的进行云服务资源开通和应用部署,将复杂的云服务资源配置和应用部署配置通过模板描述,从而实现一键式云资源与应用的开通与复制;同时在示例模板中提供了海量的免费应用模板,覆盖各热点云服务应用场景,方便您直接使用或为您设计个性化模板提供参考。 通过
配置Remote Write地址实现自建Prometheus数据上报到AOM AOM提供获取当前Prometheus实例的Remote Write地址的能力,支持将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 前提条件 已购买弹性云服务器ECS。
配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据 Prometheus监控提供了Remote read接口,该接口支持将一系列Prometheus协议的数据源组织为单一数据源查询。本节介绍如何使用自建Prometheus,通过Remote
(按需计费)来修改。 指标配置 指标采集开关用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 使用流程 AOM使用流程如下图所示。 图1 AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 购买云主机(必选) 安装ICAgent(必选) ICAgent
阈值告警最佳实践(新版) 该功能对华北-北京一、华北-北京四、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、中国-香港、华南-深圳、华南-广州-友好用户环境、华北-乌兰察布一、亚太-曼谷和亚太-新加坡区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着
Service,简称RFS)通过图形化设计器,直观便捷的进行云服务资源开通和应用部署,将复杂的云服务资源配置和应用部署配置通过模板描述,从而实现一键式云资源与应用的开通与复制;同时在示例模板中提供了海量的免费应用模板,覆盖各热点云服务应用场景,方便您直接使用或为您设计个性化模板提供参考。 通过
应用发现最佳实践 应用发现概述 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。 应用和组件的对应关系如下: 组件: 完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。
件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。 图1 分组流程 创建分组规则 用户最多可创建100条分组规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“分组规则”页签下单击 “创建分组规则”,
维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来,提升运维操作的质量和效率,帮助企业运维转型和运维价值提升。
XX小时:间隔XX小时检查一次查询和分析结果。 XX分钟:间隔XX分钟检查一次查询和分析结果。 XX秒:间隔XX秒检查一次查询和分析结果。 检查频率可以设置为15秒或30秒以实现秒级监控。指标告警的时效性取决于指标上报周期、规则检查频率及通知发送耗时。 例如,指标上报周期为15秒,规则检查频率设置为15秒,通知发送
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
创建CES告警规则 AOM作为华为云服务可观测性分析统一入口,自身并不具有云监控服务功能,AOM 2.0控制台中“告警中心 > 告警规则”下的“云监控”功能由云监控服务CES提供。用户可在AOM 2.0控制台界面操作,也可登录CES控制台界面操作。 约束与限制 如果需要在AOM控
创建AOM日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 分组、抑制、静默、屏蔽需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则、创建静默规则和创建告警屏蔽规则。
通过告警规则名称获取告警行动规则 功能介绍 通过告警规则名称获取告警行动规则。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/alert/action-rules/{rule_name} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。