检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础设施监控 工作负载监控 集群监控 主机监控 进程监控 云服务监控
创建Prometheus实例 Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例 父主题: Prometheus监控
指标管理 配置指标 配置CCE集群指标管理 父主题: Prometheus监控
产品优势 表1 产品优势 开箱即用 一键安装部署即可监控Kubernetes以及各类云产品。 一键接入各种应用组件及告警工具。 低成本 多种指标免费用,覆盖Kubernetes标准组件。 提供全托管式服务,无需另购资源,可降低监控成本,且维护成本几乎为零。 与CCE集成并提供监控服务
设置 云服务授权 访问管理 全局开关 数据订阅 采集设置 日志设置 菜单开关
应用资源管理(日落) 为什么购买的资源在“资源管理”界面看不到? “我的资源”已经释放删除了,为什么还会在界面展示? 为什么CMDB资源管理已经看到资源了,绑定环境的时候找不到资源? 搜索应用时,系统提示“AOM.11007006: get policy list failed.”
采集管理 ICAgent和UniAgent是同一个插件吗? 如何处理界面“ICAgent状态”为“离线”的问题? 在主机上手工安装ICAgent后提示安装成功,但采集器管理器界面上提示状态异常? ICAgent安装成功后,无法在界面上获取到ICAgent状态 ICAgent安装成功后
应用监控 应用洞察下的应用监控和进程监控下的应用监控有什么区别?
附录 状态码 错误码 获取账号ID、项目ID、企业项目ID 公共请求消息头 公共响应消息头
如何调用API 构造请求 认证鉴权 返回结果
通过Debugging诊断代码 Debugging诊断概述 通过Debugging诊断线程 通过Debugging诊断方法 通过Debugging诊断对象 父主题: 监控组件性能指标
虚机场景Exporter接入 接入概述 MySQL组件接入 Redis组件接入 Kafka组件接入 Nginx组件接入 MongoDB组件接入 Consul组件接入 HAProxy组件接入 PostgreSQL组件接入 Elasticsearch组件接入 RabbitMQ组件接入
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes
基本概念 应用资源管理 资源监控 自动化运维 采集管理
自动化运维 表1 自动化运维基本概念 术语 说明 脚本管理 支持Shell、Python、Bat、Powershell脚本语言以及单个脚本的多版本管理。 作业管理 将脚本和文件原子操作进行多步骤编排形成作业模板,用于完成特定运维自动化场景操作。例如初始化业务环境。 执行方案 从作业模板中挑选
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
ICAgent管理(华为云主机) 安装ICAgent 升级ICAgent 卸载ICAgent 父主题: 配置管理
配置日志采集路径 配置容器服务日志采集路径 配置虚机日志采集路径 父主题: 资源接入AOM