检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
噪等场景,为告警标识性属性。告警标注主要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签特征 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和
现不同节点间ID冲突的问题。因为ICAgent在每个节点上会自动生成唯一的ID文件,拷贝镜像后不同节点的ID文件可能会重复。 采集的日志文件是什么类型的? 在配置日志采集路径时,若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的
环境”的应用管理模型。 应用:应用资源管理的基础对象,资源管理模型的根节点。一个应用代表一个逻辑单元,可以理解为项目、产品、业务。应用创建后,每个region都可以看到相同的应用拓扑信息。 子应用:应用管理的可选节点,同一个应用下,最多可创建三层子应用。子应用可以理解为服务,对组件/微服务的归组分类。
告警降噪 概述 创建分组规则 创建抑制规则 创建静默规则 父主题: 告警管理
_threshold值必须比metric_operation为“<”的metric_threshold值大。 同一伸缩组,相同指标只能创建一条metric_operation相同的告警策略。 同一策略的同名指标(metric_name),各条件(conditions)之间需保证逻辑不冲突。
通过AOM监控组件进程 组件即您部署的服务,包括容器和普通进程。组件列表展示了每个组件的名称、运行状态、所属应用等信息。AOM支持从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对组件的立体监控。 约束与限制 每个组件最多可以创建五个标签。 标签键值长度不超过36个字符,标签值长度不超过43个字符。
配置AOM告警降噪 AOM告警降噪概述 创建AOM告警分组规则 创建AOM告警抑制规则 创建AOM告警静默规则 创建CES告警屏蔽规则 父主题: 告警监控
则。 如图5所示,单击规则名称前的,可查看该告警规则的详细信息。 在展开的列表中,只要监控对象满足设置的告警条件时,在告警列表界面就会生成一条指标类告警,您可在左侧导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。只要当前示例使用的DCS实例的CPU利用率指标满足已
行处理,处理完成后再发送通知,避免产生告警风暴。 告警降噪功能分为分组、去重、抑制、静默四部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。 图1 告警降噪流程图 分组、抑制、静默需手动创建规则,创建方式见下方文档说明。 此模块只作用
正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。
”、“SYS.”和“SRE.”开头,且以0~9、a~z、A~Z或下划线(_)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息的详细说明请参见指标维度。
产品规格差异 应用运维管理服务(简称AOM)按计费方式不同分为基础版、按需版两种,其中按需版又分为专业版和企业版。 各版本的具体规格差异请参见表1。 表1 版本规格差异说明 规格项 基础版 专业版 企业版 日志读写流量 500MB 400GB 1TB 日志索引流量 500MB 400GB
”、“SYS.”和“SRE.”开头,且以0~9、a~z、A~Z或下划线(_)组成的格式为XX.XX的3~32位字符串。 指标维度 维度是指标的分类。每个指标都包含用于描述该指标的特定特征,可以将维度理解为这些特征的类别。 系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息请分别参见后续章节。
管理访问凭证 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。每个用户只能创建一个凭证。 新建凭证 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在左侧导航栏中选择“设置 > 访问凭证”,进入访问凭证页面。 单击“同意授权”。
String 仪表盘企业项目id。获取方式请参见:获取企业项目ID。 folder_name String 仪表盘分组名称。 folder_id String 仪表盘分组id。 sync_data String 待同步的仪表盘数。 is_create_action Boolean 是否创建
read时,是否直接从本地存储读取指标 [ read_recent: <boolean> | default = false ] # 为每个 remote read 请求添加 Authorization header,password password_file 二选一 basic_auth:
100+ 创建告警规则数 仅支持1000。 默认3000+,最多支持10000+。 告警模板可添加告警规则数 仅支持50。 支持添加20+云服务,每个云服务支持添加100+告警规则。 历史告警保存时间 7天。 1年。 单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。
查询UniAgent主机列表信息 功能介绍 该接口用于查询执行过安装UniAgent任务的主机列表信息。该接口对租户不开放,仅支持白名单服务COC使用。如其他服务有需求,可通过提交工单,申请开放此接口。 调用方法 请参见如何调用API。 URI POST /v1/uniagent
若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认POSTGRESQL。 插件版本 选择插件的版本。未上线的插件版本,则置灰,无法选择。 采集任务 采集任务名
若当前没有可选的Prometheus实例,可以创建Prometheus for ECS类型实例。 插件配置 操作系统 主机的操作系统,当前只支持选择Linux。 采集插件 默认POSTGRESQL。 插件版本 选择插件的版本。未上线的插件版本,则置灰,无法选择。 采集任务 采集任务名