检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“指标管理”页面的“指标”页签下,选择集群。 选择Job:{namespace}/elasticsearch-exporter,可以查询到elasticsearch开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
请求Body参数 参数 是否必选 参数类型 描述 component_id 是 String 环境关联组件id;id长度不能超过36位,由大小写字母、数字组成。创建环境必传,修改环境时非必选 description 否 String 描述 env_name 是 String 环境名称 env_type
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 实践场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
主机ID(暂不使用,传空即可)。 id 是 String 创建时填空,修改时填规则ID。 name 是 String 规则名称。 字符长度为4到63位,以小写字母a-z开头,只能包含0-9/a-z/-,不能以-结尾。 projectid 是 String 租户从IAM申请到的projectid,一般为32位字符串。
在“指标管理”页面的“指标”页签下,选择对应集群。 选择Job:{namespace}/mysql-exporter,可以查询到mysql开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
在“指标管理”页面的“指标”页签下,选择对应集群。 选择Job:{namespace}/mysql-exporter,可以查询到mysql开头的自定义指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
for CCE”实例名称,进入实例详情页面。 在“指标管理”页面的“指标”页签下,选择集群。 在搜索框输入redis,能够搜索出redis开头的指标,即可证明指标成功接入AOM。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
for CCE”实例名称,进入实例详情页面。 在“指标管理”页面的“指标”页签下,选择集群。 在搜索框输入redis,能够搜索出redis开头的指标,即可证明指标成功接入AOM。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
在“指标管理”页面的“指标”页签下,选择对应集群。 选择Job:{namespace}/postgres-exporter,可以查询到pg开头的postgresql指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
在“指标管理”页面的“指标”页签下,选择对应集群。 选择Job:{namespace}/postgres-exporter,可以查询到pg开头的postgresql指标。 在AOM上配置仪表盘和告警 通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。
字符串。 id 是 String - 创建时填空,修改时填规则ID。 name 是 String 字符长度小于64位,以小写字母(a-z)开头,只能包含0-9/a-z/-,不能以-结尾。 规则名称。 createTime 否 String - 创建时间(创建时不传,修改时传查询返回的createTime)
事件或者告警清除的时间,CST毫秒级时间戳,为0时表示未删除。 timeout 否 Long 告警自动清除时间。毫秒数,例如一分钟则填写为60000。默认清除时间为3天,对应数字为 4320 * 1000(即:3天 * 24小时 * 60分钟 * 1000毫秒)。 metadata 否 Map<String,String>
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
指标命名空间。namespace中不允许存在":"符号,取值范围格式为service.item;service和item必须是字符串,必须以字母开头,只能包含0-9/a-z/A-Z/_,总长度最短为3,最大为32,service不能为“PAAS”。 最小长度:3 最大长度:32 表6 Dimension2
id String 脚本id,根据UUID.randomUUID生成。 最小长度:1 最大长度:64 name String 脚本名称,支持数字,下划线,大小写字母 ,中文 最小长度:1 最大长度:64 online_exist_status Boolean 脚本中是否有已上线的版
事件或者告警清除的时间,CST毫秒级时间戳,为0时表示未删除。 timeout Long 告警自动清除时间。毫秒数,例如一分钟则填写为60000。默认清除时间为3天,对应数字为 4320 * 1000(即:3天 * 24小时 * 60分钟 * 1000毫秒)。 metadata Map<String,String>
资源监控 表1 资源监控基本概念 术语 说明 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计
添加或修改指标类或事件类告警规则 功能介绍 添加或修改AOM2.0指标类或事件类告警规则。(注:接口目前开放的region为:华东-上海一) 调用方法 请参见如何调用API。 URI POST /v4/{project_id}/alarm-rules 表1 路径参数 参数 是否必选