检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建统计规则 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可创建统计规则。统计规则创建成功后,AOM能够针对您配置的关键词周期性地进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。
口,查询当前监控的时间序列名称的时间序列维度列表。取值范围:数组不能为空,同时数组中任何一个dimension对象name和value属性的值也不能为空。 metricName 是 String 指标名称。名称长度取值范围为1~255个字符。取值范围:AOM提供的基础指标,cpu
fill_value 否 String 用于对查询到的时序数据进行断点插值,默认值为-1。 -1:断点处使用-1进行表示。 0 :断点处使用0进行表示。 null:断点处使用null进行表示。 average:断点处使用前后邻近的有效数据的平均值进行表示,如果不存在有效数据则使用null进行表示。
日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序 在任务列表的表头,单击各列的,可切换任务的排序,为正序排序,为倒序排序。 父主题: 管理采集插件平台UniAgent
日志。 过滤任务信息 在任务列表的表头,单击各列的,可按特定类型过滤显示任务的信息。 切换任务排序 在任务列表的表头,单击各列的,可切换任务的排序,为正序排序,为倒序排序。 父主题: 管理采集插件平台UniAgent
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。
related_cloud_service String 关联的云服务。 related_cce_clusters Array of strings 关联的CCE集群。 related_prometheus_instances Array of strings 关联的Prom实例。 alarm_notification
Service,简称OBS)的OBS桶中,以便进行长期存储。如果您有更长时间的日志存储需求,可添加日志转储。 AOM提供周期性转储和一次性转储两种转储方式,供您选择使用。 周期性转储:将当前日志实时转储到OBS桶中,且以转储周期为粒度对1天的日志进行分割,同一时间段的日志将转储到其对应的日志文件中。
资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
执行脚本任务失败,提示 :agent not found 问题现象 在ECS执行脚本任务时失败,系统提示“agent not found”。 可能原因 没有正确安装UniAgent。 UniAgent为非“运行中”状态。 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中
柱状图展示了满足2中已设查询条件的日志条数在时间上的分布。横轴显示时间,并对横轴进行30等分,即将横轴均分为30个矩形块,每个矩形块表示的时间为已选择的时间范围/30,例如,时间范围选择近30分钟,则每个矩形块表示的时间为1分钟,若时间范围选择近60分钟,则每个矩形块表示的时间为2分钟,纵轴显示查询到的日志条数。
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格式
也可以根据自身需求定制相应的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见管理脚本、管理文件。 云服务场景 云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速
”界面。 在左侧导航栏中选择“参数库”,单击右上角的“创建参数”。 填写参数信息,具体的参数说明请参见表1。 图1 填写参数信息 表1 填写参数信息 参数名称 说明 参数类型 参数的类型,目前仅支持字符串类型。 参数名称 参数的名称。 最多可输入64个字符,只能由大小写字母组成。
添加成功后,指定资源当前新产生的日志将会实时转储到OBS桶中。 例如,als0320a当前新产生的日志会实时转储到OBS桶obs-store-test的/home/Periodical Dump目录下,且每3个小时的日志转储到其对应的日志文件中。 将存储在OBS中的日志文件下载到本地,以供定位问题使用。
计费云服务:除Modelarts/IotDA/IEF/CSE以外,其它云服务接入Prometheus实例后均会产生计费。 ECS场景 在ECS场景自建中间件,会产生计费。 在ECS场景安装Node Exporter,部分指标会产生计费。 其它可能场景 除几类基础指标以外,其它指标上报到AOM均可能产生计费。
配置指标存储时长 本节介绍如何配置云服务、ECS、CCE、 多账号聚合实例、APM、通用实例与default类型Prometheus实例的指标存储时长。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 当前配置指
实现去重的效果,用户无需手动创建规则。 分组、抑制、静默需手动创建规则,具体的创建方式请参见创建分组规则、创建抑制规则和创建静默规则。 约束与限制 此模块只作用于消息通知部分,所有触发的告警和事件都可在“告警列表”页面查看。 告警降噪中所有的规则条件均取自告警结构体中的"meta
通过为中间件及自定义插件创建采集任务,并执行插件脚本,AOM就可以对相应的中间件及自定义插件指标进行监控,结合开源Grafana可以提供一站式全方位的监控体系,帮助业务快速发现和定位问题,减轻故障给业务带来的影响。 为了快速了解并进行中间件及自定义插件接入AOM服务,建议您按照如下步骤进行操作:
单击告警条件后的,可将对应行的指标数据和告警条件转换为Prometheus命令。 单击告警条件后的,可快速复制对应行的指标数据及告警条件等信息,并根据需要修改。 单击告警条件后的,可删除对应行指标数据的监控。 图8 设置告警规则详情 表5 告警规则详情填写说明 参数名称 参数说明 多指标 按设置的多个指标