检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品功能 应用监控 应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表->应用详情->组件详情->实例详情->进程详情。即在应用监控中,将应用、组
通过仪表盘监控Prometheus实例指标数据 通过系统预置的仪表盘模板,用户可以快速监控云服务类型和default类型Prometheus实例的指标数据,及时定位并发现资源数据存在的问题,提升运维效率。 前提条件 服务已接入云服务类型Prometheus监控并接入云服务,具体请参见Prometheus实例
基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring/coredns/0
开源监控系统接入AOM AOM作为华为云服务可观测性分析统一入口,提供接入中心,通过创建Prometheus 通用实例实现开源监控系统接入AOM。 应用场景 Prometheus 通用实例类型,适合已经自建了Prometheus服务器,但需要通过远端存储(Remote Write
监控云容器引擎 CCE的指标 云容器引擎 CCE是一个企业级的集群托管服务,基于云服务器快速构建高可靠的容器集群,帮助您轻松创建和管理多样化的容器工作负载。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes
创建AOM指标告警规则 通过指标告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建、按Prometheus命令创建。 约束与限制 当指标告警规则的状
创建AOM应用性能监控告警规则 通过创建应用性能监控类型告警规则可对资源的指标设置阈值条件,当指标数据满足阈值条件时产生阈值告警。 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用
公共请求消息头 表1 公共请求消息头 名称 描述 是否必选 示例 X-Auth-Token 用户Token。 使用Token认证时必选 - Content-Type 内容类型。 该字段内容填为“application/json;charset=utf8”。 必选 applicat
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的
统计图表说明(新版) 仪表盘功能支持通过统计图表的方式将指标数据、日志数据的查询和分析结果进行可视化展示。 指标数据类图表 指标类图表支持选择的图表类型有:折线图、数字图、TopN、表格、柱状图、数字折线图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多
AOM告警监控概述 AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。
自定义插件接入AOM 您可以创建一个插件,在插件中通过脚本自定义需要上报到AOM的指标数据,并通过该自定义插件创建采集任务,即可采集自定义的指标数据到AOM,以监控该指标数据。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 创建自定义插件
管理Prometheus实例 AOM支持创建各种类型的Prometheus实例。Prometheus实例创建完成后,可在实例列表中查看Prometheus实例的名称、类型、企业项目等信息,并可根据需要修改、删除Prometheus实例。 创建Prometheus实例 登录AOM 2
建设完整指标体系,实现立体化监控 本文档介绍如何建设完整的指标体系和统一监控大盘,实现资源和应用的全方位、立体化、可视化监控。 实践场景 用户体验至上的互联网时代,页面的响应速度、访问时延和页面的访问成功率常常会影响用户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
管理定时运维 “定时运维”页面展示所有定时任务的执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作。定时任务单用户最多支持创建100个。 创建任务 登录AOM 2.0控制台。
批量创建AOM云服务告警规则 告警模板是一组以云服务为单位的告警规则组合,通过告警模板用户可对同一个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 您最多可创建150个告警模板,如果告警模板数量已达到150个,请删除不需要的告警模板后重新创建。
管理AccessCode AccessCode是调用API的身份凭据。通过创建AccessCode可为当前用户配置API服务的调用权限。该权限设置针对整个AOM 2.0服务生效。 约束与限制 每个用户最多可创建2个AccessCode。 AccessCode删除后将无法恢复,请谨慎操作。