检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
接入LTS 概述 管理接入规则 父主题: 日志管理
在“概览”页签,展示环境指标以及应用层和基础设施类信息。 在“性能”页签,查看该环境的性能信息。使用此功能需要提前获取APM的相关权限,详情请参见APM权限管理。 在“调用链”页签,查看URL、调用方法等信息请求成功、请求失败、响应时间、产生时间记录。使用此功能需要提前获取APM的相关权限,详情请参见APM权限管理。
阈值条件,当指标数据满足设置的告警阈值条件时产生告警。 准备工作 购买一台弹性云服务器,详细请参考快速购买和使用Linux ECS。如果您已有可用的弹性云服务器,可重复使用,不需要再次购买。 已开通AOM 2.0并授权。 ECS主机安装 UniAgent 登录AOM 2.0控制台。
升级失败 主机ICAgent升级失败,请登录服务器卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型
兆字节(MB) 显存使用率(aom_node_gpu_memory_usage) 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) 显存使用量(aom_node_gpu_memory_used_megabytes) 该指标用于统计测量对象已使用的显存。 ≥0
的cpu使用率 定义变量: pod中容器的cpu实际使用量:aom_container_cpu_used_core node的cpu实际总量:aom_node_cpu_limit_core 查询逻辑: 针对指标aom_container_cpu_used_core,使用聚合函数s
通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。详细操作请参见:云服务指标接入AOM。 应用运维管理(AOM)、API网关(APIG)、Astro轻应用(Astro Zero)、裸金属服务器(BMS)、云堡垒机(CBH)、云容器引擎(CCE)、内容分发网络(CDN)、云防火墙(CF
创建用户并授权使用自动化运维 如果您需要对您所拥有的自动化运维进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建I
业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间
单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。 对接线下Grafana 不支持 支持以Prometheus数据源的方式直接对接到线下Grafana。
url"修改成Prometheus的访问域名。 修改以上两个配置文件之后,重启grafana pod,即可查看到监控数据。 父主题: 常见使用问题
er的方式来监控Memcached运行状态。本文为您介绍如何使用Prometheus监控服务Memcached。 约束与限制 为了方便安装管理Exporter,推荐使用云容器引擎 CCE进行统一管理。 前提条件 CCE服务已拥有CCE集群,已安装Memcached。 服务已接入可
"aom:alarmRule:create" ] } ] } 示例2:拒绝用户删除应用发现规则 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予AOM F
原因:该问题是由于您是以IAM用户登录AOM,但IAM用户没有消息通知服务的访问权限导致的。 影响:无法使用邮件、短信等通知功能。 解决办法 请联系IAM用户所属的账号管理员增加消息通知服务的访问权限,增加消息通知服务的访问权限操作如下: 使用IAM用户所属的账号登录统一身份认证服务后,为IAM用户增加消息通知服
分钟和5分钟),上报周期内获取不到数据会报数据不足。 指标删除或指标所在的宿主已不存在,而阈值规则仍在,此时会报数据不足。 父主题: 常见使用问题
下面以监控ELB业务层全量指标为例说明,如何使用分组规则清除告警风暴。 创建分组规则:使用分组规则功能,从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 创建全量指标告警规则:通过设置告警规则并关联分组规则,实时监控环境中主机、组件等资源使用情况。 前提条件
Exporter接入AOM实现指标监控 应用场景 使用数据库Redis过程中需要对Redis运行状态进行监控,以便了解Redis服务是否运行正常,及时排查Redis故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Redis运行状态。本文为您介绍如何使用Prometheus监控Redis。
Exporter接入AOM实现指标监控 应用场景 使用Kafka过程中需要对Kafka运行状态进行监控,例如集群状态、消息消费情况是否有积压等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Kafka运行状态。本文介绍如何部署Kafka Exporter以及实现Kafka
数据采集失败:调openstack接口失败,或采集的hostid为空。 请查看ICAgent的日志并检查配置,根据日志报错判断原因。 父主题: 常见使用问题