检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
卸载后重新安装。 离线 AK/SK配置不正确或30200、30201端口未连通,处理操作详见如何处理界面“ICAgent状态”为“离线”的问题。 异常 主机ICAgent功能异常,请联系技术人员处理。 可能原因二:AOM不支持监控当前资源类型 修复建议:请检查您的资源是否为AOM
自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。 镜像概述 镜像是一个包含了
资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK
指标数据存储时长 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 关联指标项存储时长 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 指标维度个数
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? UniAgent和ICAgent安装类常见问题 如何在VPCEP控制台为AOM/LTS创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? E
维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
负载名称、命名空间、集群、负载类型、区域、应用环境、最近更新时间。 集群 集群名称、集群ID、区域。 数据库 关系型数据库RDS - 实例名称/ID、实例类型、数据库引擎版本、资源状态、内网IP、区域、应用环境、操作。 文档数据库DDS - 名称/ID、资源状态、实例类型、版本、企业项目、区域、应用环境、操作。
云服务场景展现启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载已上架的工具卡片。可以使用卡片快速创建任务,也可以对卡片进行收藏或下架操作,具体操作参见启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。
表1 AOM 最佳实践一览表 最佳实践 说明 通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 通过多账号聚合Prometheus实例实现指标数据统一监控 本
错误码 错误码 错误信息 处理措施 SVCSTG.PE.4031012 Failed to verify the project ID. 请检查对应的参数是否符合要求。 SVCSTG.PE.5001205 Failed to delete records. 请联系技术支持工程师解决。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警” 告警标签 单
应用管理的使用说明 应用管理用于管理云服务对象与应用之间的关系,遵循“应用 + 子应用(可选)+ 组件 + 环境”的应用管理模型,主要用于管理ECS、RDS和ELB等云服务资源。 创建应用 添加节点 添加环境 关联资源 图1 应用管理模型 父主题: 应用管理
修改Prometheus实例 功能介绍 该接口用于修改Prometheus实例。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/aom/prometheus 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。
根据设置的频率对指标数据查询和分析结果进行检查。 固定间隔 1分钟 告警恢复 连续多少个周期不满足告警条件,恢复告警。 1 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 开启:连续周期“1”达到数据不足,状态设置“数据不足并发送告警” 告警标签 单
当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 更多服务错误码请参见API错误中心。 状态码 错误码 错误信息 描述 处理措施 200 SVCSTG.INV.2000000 null 请求正常执行 请求执行完成无需处理。 200 SVCSTG_AMS_2000000 null
指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。
ECS主机上执行UniAgent安装命令,下载安装脚本失败 问题描述 在通过华为云购买的ECS主机上执行UniAgent安装命令时,下载安装脚本失败,出现如下报错信息:Cloud not resolve host: aom-uniagent-xxxxxxxxxxxxxxxxxxxxxxxxxxxx。 图1 报错信息
会将数据投放到Kafka队列中,利用Kafka高吞吐的能力,实时将数据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。