检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Prometheus监控简介 Prometheus监控概述 功能特性 产品优势 基本概念 父主题: Prometheus监控
进程监控 应用监控 组件监控 应用发现 父主题: 基础设施监控
日志分析(旧版) 搜索日志 查看日志文件 配置虚机日志采集路径 添加日志转储 接入LTS 日志流
CCE容器场景自建中间件接入 PostgreSQL Exporter接入 MySQL Exporter接入 Kafka Exporter接入 Memcached Exporter接入 MongoDB Exporter接入 ElasticSearch Exporter接入 Redis
监控JAVA应用 快速接入Agent 为部署在CCE容器中的JAVA应用安装Agent 父主题: 接入中心
接入中心 接入中心总览 接入管理 监控JAVA应用 监控Node.js应用
组件列表 组件列表总览 拓扑 Profiler性能分析 Debugging诊断 接口调用 基础监控 异常 外部调用 通信协议 数据库 Web容器 消息队列 远程过程调用 日志 基础设施 调用链 组件设置 父主题: 应用监控
告警管理 如何区分告警和事件?
Prometheus监控 如何将Prometheus数据接入到AOM? Prometheus监控功能采集的指标数据,如何区分基础指标和自定义指标?
查看告警 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。“告警列表”页面提供告警查询和处理功能,便于您更快地发现、定位并恢复故障。 功能介绍 在告警列表中,有以下关键功能:
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
基本概念 应用资源管理 资源监控 自动化运维 采集管理
从作业模板中挑选1个或多个步骤组合组成执行方案。是作业模板的实例化对象。 云服务场景 云服务提供的原子化的变更场景。例如重启ECS。 标准化运维 将脚本、文件管理、执行方案、云服务场景组合合成一套操作流程,用于标准化特定场景的运维场景变更。 服务场景 将作业、标准化运维发布成服务,用户无需感知底层操作逻辑,仅输入简单的信息即可自助完成特定运维场景。
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
集群指标 clusterId 集群ID。 clusterName 集群名称。 projectId 项目ID。 容器指标 appID 服务ID。 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。 containerID 容器ID。 containerName
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM
参考信息 Agent包下载配置
升级AOM 手动升级 一键迁移
告警行动规则 概述 创建告警行动规则 创建消息模板 父主题: 告警管理