检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。 表1 AOM的监控安全风险 监控安全风险 简要说明 详细介绍 资源监控 AOM提供应用监控、工作负载监控、集群监控、主机监控、指标浏览等功能,支持实时监控您的应用及相关云资源,并将数据可视化展示,帮助用户快速分析应用健康状态。
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
ElasticSearch Exporter接入 操作场景 使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控ElasticSearch运行
Kafka Exporter接入 操作场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
AOM配置日志转储时无法选中obs桶是什么原因? 问题描述 账号有OBS的权限,但在日志转储下无法查看OBS桶列表,报错码:LTS.0203。 可能原因 用户未给该子账号添加LTS权限。 解决方法 登录管理员账号,进入统一身份认证服务控制台。 在用户页面,找到需要添加LTS权限的用户名,单击右侧操作列的“授权”。
日志接入 可以将应用资源管理中主机待采集日志的路径配置到日志流中,ICAgent将按照日志采集规则采集日志,并将多条日志进行打包,以日志流为单位发往AOM,您可以在AOM控制台实时查看日志。 前提条件 已为应用添加组件和环境,详情请参见添加节点和添加环境。 已创建需要映射的日志组
其他相关操作 在虚机接入中,您可以对已创建的UniAgent的主机进行其他相关操作,具体的操作有: 表1 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过主机IP、导入IP、主机名称、安装机名称和代理IP来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
ElasticSearch Exporter接入 操作场景 使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控ElasticSearch运行
Kafka Exporter接入 操作场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
创建静默规则 通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。 创建静默规则 用户最多可创建100条静默规则。 在左侧导航栏中选择“告警 > 告警降噪”。 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。 图1 创建静默规则 表1
操作日志 操作日志会记录显示用户对UniAgent和其他插件执行安装、升级、卸载日志操作。 查看UniAgent操作日志 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中,选择“采集设置 > 操作日志 > UniAgent操作日志”。 可
Prometheus实例读写地址支持公网的局点 华为云用户应使用公网Remote Read地址和Remote Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明
添加阈值规则(即将下线) 功能介绍 该接口用于添加一条阈值规则,包括如下工作。 URI POST /v1/{project_id}/ams/alarms 替换接口请参考添加阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
标签和标注 创建告警规则时,可设置告警标签(Alarm Tag)和告警标注(Alarm Annotation)。告警标签主要应用于告警降噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
"hint" : "", "id" : "xxxxxxxxxx", "param_group" : "ecs_instance", "param_name" : "xxxxx", "param_type" : "HOST"
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
菜单开关 AOM支持用户自定义选择在控制台导航栏中显示或隐藏“概览”、“应用洞察”、“自动化运维”、“云服务监控”、“业务监控”等功能。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“设置”,进入全局配置界面。 在左侧导航栏中选择“菜单开关”,所有开关默认关闭,用户可以根据需要开启对应功能开关。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,