检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
y}_${event_type}_${clear_type}]于${starts_at}时间发生告警\",\"content\":\"华为云账号:${domain_name};\\n通知类型:${event_type};\\n事件级别:${event_severity};\\n事
> 实例列表”。 在Prometheus实例列表中,单击目标Prometheus实例的名称,进入该实例的详情界面。 在左侧导航栏单击“指标管理”,在“指标”页签下即可查看当前Prometheus实例所有指标的指标名、指标类型等信息。 父主题: Prometheus监控
原因:该问题是由于您是以IAM用户登录AOM,但IAM用户没有消息通知服务的访问权限导致的。 影响:无法使用邮件、短信等通知功能。 解决办法 请联系IAM用户所属的账号管理员增加消息通知服务的访问权限,增加消息通知服务的访问权限操作如下: 使用IAM用户所属的账号登录统一身份认证服务后,为IAM用户增加消息通
创建用户并授权使用AOM 如果您需要对您所拥有的AOM进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用AOM资源。
设置完成,单击“确定”。 (可选)变量管理。CCEFromProm服务新增PromQL告警规则时,管理变量并应用在告警模板的PromQL中。 单击“变量管理”。 在弹出的对话框“变量管理”中设置变量与变量值。最多可以新增50个变量。 图4 变量管理 设置完成,单击“确定”。 单击“确定”,完成告警模板创建。
当ICAgent无法采集资源的指标时资源状态为通道静默,通道静默可能由于但不限于以下原因导致: 可能原因一:ICAgent问题 修复建议:在左侧导航栏中选择“配置管理 > Agent管理”,在列表的“ICAgent状态”列查看ICAgent状态,若状态不为“运行”,则说明ICAgent未安装或运行异常,可参考表1进行处理。
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
删除策略 功能说明 该接口用于删除指定策略。 URI DELETE /v1/{project_id}/pe/policy 请求消息 请求消息头 请求消息头如表1所示。 表1 请求消息头 参数 描述 是否为必选 示例 Deployment-Name 应用名 必选 - Policy-Id
通过控制台获取企业项目ID 在调用接口时,部分URI中需要填入企业项目ID,在“企业”页面可以获取这些信息。 登录控制台。 单击页面右上方的“企业 > 项目管理”。 在“名称/ID”列可复制企业项目ID,也可单击企业名称,进入企业项目详情页,查看企业项目相关信息。 父主题: 附录
当前账号欠费,故采集器停止采集。 日志流写入速率和单行日志长度超出使用限制。 解决办法 安装ICAgent,方法如下: 在左侧导航栏中选择“配置管理 > Agent管理”。 选择对应集群,单击“安装ICAgent”,然后在弹出的提示框单击“确定”。 等待“ICAgent状态”列显示为“运行”,则表示ICAgent安装成功。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
如何设置全屏模式在线时长? 为保障客户信息的安全性,AOM提供了在线超时退出机制,即:登录控制台后,打开任意一个界面,如果在1小时内无任何操作,则会自动退出到登录界面。 当在使用AOM的全屏模式(包括运维概览全屏模式和仪表盘全屏模式)进行监控时,全屏模式会随着用户账号的退出而退出
支持多实例聚合查询,例如:按标签、按资源组等聚合。 PromQL语法 不支持 支持,告警规则、仪表盘、指标浏览等监控功能均支持。 仪表盘 支持标准云产品的单实例大盘。 提供丰富的预置模板。 仪表盘支持的图表类型 2 8+ 仪表盘支持的监控视图数 50 100+ 创建告警规则数 仅支持1000。
AOM告警规则概述 AOM提供告警规则和事件规则设置功能。通过创建指标、日志、云监控和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况,便于您更快地发现、定位并恢复故障。通过创建事件告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 功能说明 指标告警规则
AOM告警降噪概述 AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 功能说明 告警降噪功能分为分组、去重、抑制、静默、屏蔽部分。 去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的
获取Prometheus实例调用凭证 功能介绍 该接口用于获取Prometheus实例调用凭证。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/access-code 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
更新策略 功能说明 该接口用于修改策略规则。告警策略支持更新,定时和周期策略不支持更新。 URI PUT /v1/{project_id}/pe/policy/{policy_id} 参数说明请参见表1 表1 参数说明 参数名称 是否必选 描述 project_id 是 项目ID
新增一条事件类告警规则 功能介绍 新增一条事件类告警规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
删除指标类或事件类告警规则 功能介绍 删除AOM2.0指标类或事件类告警规则。 调用方法 请参见如何调用API。 URI DELETE /v4/{project_id}/alarm-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String