检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修改阈值规则(即将下线) 功能介绍 该接口用于修改一条阈值规则,包括如下工作。 URI PUT /v1/{project_id}/ams/alarms 替换接口请参考修改阈值规则。 请求消息 请求参数 请求参数如表1所示。 表1 请求参数 参数 是否必选 参数类型 取值范围 描述
进行筛选,以便将满足条件的日志进行转储。 日志类型选择组件,组件选择als0320a 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group1 转储周期 对1天的日志以转储周期为粒度进行分割,将每天
自定义插件接入 操作场景 您可以使用自定义插件创建采集任务,监控用户指定的相关指标,并通过Exporter上报数据库指标,用于异常报警和Grafana监控大盘展示。 前提条件 主机已安装UniAgent。 已创建ECS Prometheus实例。 已创建自定义插件。 创建自定义插件
Redis Exporter接入 操作场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行状态。本文为您介绍
户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。
2021-10-20 支持创建告警行动策略。关联SMN主题与消息模板,通过创建消息模板,自定义通知消息配置。 支持创建告警降噪策略。告警降噪策略分为路由分组、去重、抑制、静默四部分,作用于发送告警通知之前对告警按照策略规则链条进行处理,通过所有规则后,再发送通知。 2021-08-20 支持AOM日志接入LTS
行转储。 日志采集时间选择30分钟,组件选择als0320a,关键词设置为warn。 日志分组名称 待转储日志的逻辑分组,以便以分组为单位对日志进行转储。 说明: 转储任务删除后,日志分组也会同时删除。 log-group2 目标OBS桶 存储日志的OBS桶。 说明: 如果没有创
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 图1 日志采集开关
查看告警规则详细信息 单击规则名称前的,可查看该告警规则的详细信息,包括每个规则的基本信息、告警条件等。指标告警规则还可查看监控对象及触发的告警列表信息。 查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在
瞬时查询和时间跨度查询,内置多种函数和操作符。可以对原始数据进行聚合、切片、预测和联合。 Sample 一条时间线在某个时间点对应的数值。在Prometheus监控服务中,每个Sample由一个float64数据类型的值和一个毫秒精度的时间戳构成。 告警规则 Prometheus监控Alerting
如果进程的“COMMAND”列的值为“python”,则组件名取命令行中第一个py/pyc脚本名,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“node”,则组件名取命令行中第一个js脚本名,应用名使用默认值unknownapplicationname。
展示(拓扑图)。拓扑图主要是由圆圈、箭头连线和资源组成。每个圆圈代表一个服务,圆圈上每个分区代表一个实例。每个圆圈中的分数表示活跃的实例/总实例数。分数下的内容分别表示在当前所选的时间内服务被调用次数、响应时延、错误数。每个箭头连线代表一个调用关系。调用次数越多,连线越粗。连线上
管理主机组(新版) 主机组是为了便于分类管理、提升配置多个主机数据采集的效率,对主机进行虚拟分组的单位。您可以将多个主机加入到同一个主机组,并将该主机组关联至对应的接入配置中。配置接入规则时以主机组为单位下发采集配置,方便您对多台主机数据进行采集。当用户扩容主机时,只需在主机组中
如果进程的“COMMAND”列的值为“python”,则组件名取命令行中第一个py/pyc脚本名,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“node”,则组件名取命令行中第一个js脚本名,应用名使用默认值unknownapplicationname。
告警降噪:对告警信息自动匹配告警降噪分组规则后再发送告警,防止产生告警风暴。 选择告警降噪方式,默认会启用静默规则,请根据需要设置是否启用告警降噪的分组规则。启用后,请从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可在下拉列表中单击“新建分组规则”添加,具体操作请参见创建分组规则。 说明:
分布。横轴显示时间,并对横轴进行30等分,即将横轴均分为30个矩形块,每个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。 图1 通过柱状图查看统计数据
抑制规则的描述。最多不能超过1024个字符。 抑制规则 根源告警 根源告警表示产生抑制的某类特定告警。 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。
为了能精准的探测到符合您预期的进程,建议您在添加检查项时,填写进程的独有特征,即填写更容易识别出预期进程的关键字作为检查项。 您至少要添加一条检查项,检查项您最多可添加5条。当有多条检查项时,所有检查项同时满足,AOM才能发现进程。 添加检查项完成后,单击“开始探测”,查找符合的进程。
数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的错误率以快速定位根因,下钻到应用下具体
可根据需求灵活选择。CSV格式可导出日志的内容、主机IP、来源等详细信息(如图1所示)。TXT格式只能导出日志的内容(如图2所示),每行为一条日志。 图1 以CSV格式导出日志 图2 以TXT格式导出日志 (可选)单击“配置转储”,将搜索到的日志一次性转储到OBS桶的同一个.lo