检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
响。 为了快速了解并进行中间件及自定义插件接入AOM服务,建议您按照如下步骤进行操作: 给虚机安装采集器底座UniAgent,用于安装Exporter,并创建采集任务。详情请参考:安装UniAgent。 创建ECS类型Prometheus实例,采集任务通过关联ECS Promet
ount 配置个数 ServiceComb配置个数。 ≥0 个 Nacos config nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。
据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
enable Boolean 规则是否启用 trigger_policies Array of trigger_policies objects 触发策略 数组长度:0 - 1024 alarm_type String 告警类型。notification:直接告警。denoising:告警降噪。
M预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 告警时延设置:支持配置0.5s、1s、3s、5s、10s。 错误时延设置:支持配置1s、3s、5s、10s、15s。 单击组件之间的连线,会在右侧显示详细的请求数、平均RT、错误率等数据。
”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台。 在左侧导航栏中选择“告警 > 告警规则”。 选中一个或多
”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台 。 在左侧导航栏中选择“告警 > 告警规则”。 选中一个或
在常用中间件Exporter接入AOM中,已经提供部分常用中间件Exporter接入指导,您可以参考相关实践步骤,在CCE集群中部署其他的Exporter,并配置CCE集群指标采集规则,然后进行验证。 父主题: CCE容器场景自建中间件接入AOM实现指标监控
当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 告警通知 告警通知有2种方式: 直接告警:在配置告警规则的时候,可以配置告警通知规则,将告警信息通知相关人,以便提醒相关人员及时采取措施清除故障。告警方式包括邮件、短信、钉钉、企业微信、语音等方式。
仪表盘支持通过变量拼接填充图表标题。新增变量后,在仪表盘配置图表标题处使用“${变量名称}”进行拼接填充,即可基于该变量的过滤器下拉列表值,动态展示图表标题信息。 例如:仪表盘配置的原图表标题为“Dashboard”,新增的变量名称为“ClusterName”,即可以在仪表盘图表标题处配置“${ClusterName}
le需设置为false。 bind_notification_rule_id String 告警行动策略id。 当notification_enable为true时,填告警行动策略id 当notification_enable为false时,填“” notify_resolved
“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心 AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS
费用(除重复映射外)。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流无法在LTS控制台查看。您可以通过在AOM控制台添加接入规则来创建映射,映射创建后,即可通过LTS查看和分析AOM日志。
工程师为您开放此功能。 什么是映射 AOM中的日志实际上是以一个日志流的形式在LTS中存在(如图1中的AOM日志流所示),AOM可以查询已配置采集路径的原始日志,但当前AOM的日志流无法在LTS控制台查看。您可以通过在AOM控制台添加接入规则来创建映射,映射创建后,即可通过LTS查看和分析AOM日志。
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
S桶中,以便进行长期存储。日志数据的相关费用统一由LTS提供并上报话单,AOM不会双算。 指标数据:通过数据订阅功能,将指标数据转发到用户配置的DMS或Webhook的Topic中存储。
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自
“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 接入中心 AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS
AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全
AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持多集群方案,当一个集群异常时,可以继续提供服务。 数据容灾 AOM的配置、指标、告警等数据均是多副本存储,保证了数据可靠性。 父主题: 安全