检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应
主机监控 主机包括弹性云服务器(ECS)、裸金属服务器(BMS)。AOM既可监控通过创建CCE、ServiceStage集群时购买的主机,也可监控非CCE、ServiceStage集群环境下购买的主机(购买的主机操作系统需满足操作系统及版本,且购买后需要给主机安装ICAgent,
通过Prometheus监控服务将指标数据上报到AOM后,即可在“资源消耗”界面查看上报的基础指标和自定义指标数量,方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for ECS Prometheus实例 for CCE Prometheus
kube_pod_container_status_waiting_reason waiting容器的reason kube_pod_info Pod信息 kube_pod_labels Pod标签 kube_pod_owner Pod的Owner信息 kube_pod_status_phase
非华为云主机安装ICAgent后为何无数据上报? 当您在非华为云主机上安装了ICAgent后,ICAgent上报数据需要访问如下端口,如果本地有防火墙配置,请打开如下端口的出方向否则对应数据无法上报,对应功能不可用。 8149: 上报指标数据使用 8102: 上报日志数据使用 8923: 上报APM(调用链、JVM)指标使用
创建事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理
prom_spec_config PromConfigModel object Prometheus实例所属特定配置。 cce_spec_config String Prometheus实例所属CCE特殊配置。 表6 PromConfigModel 参数 参数类型 描述 remote_write_url
Read方式读取Prometheus实例数据 Prometheus监控提供了Remote read接口,该接口支持将一系列Prometheus协议的数据源组织为单一数据源查询。本文介绍如何使用自建Prometheus,通过Remote read接口读取AOM Prometheus实例的数据。 前提条件 服务已接入可观测Prometheus
APM指标数据未采集上来,可能有哪些原因? 如果APM探针刚接入,可以稍微等待几分钟后,就能看到数据。 如果显示数据采集被停止,可能的原因有: 实例级别停止,APM探针管理中采集被停止。 监控项级别停止,监控项状态列表某些监控项采集被人为停止。 APM控制台的“全局配置(系统管理
前没有root的计划任务。 解决方法 无需解决。 只要系统回显信息包含“ICAgent install success”,即表示ICAgent安装成功,ICAgent的数据采集等功能即可正常使用。 父主题: 常见使用问题
AOM告警规则状态为什么显示“数据不足”? AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足。 指标
CAgent上报相关的运维数据。 API接入数据 通过AOM提供的OpenAPI接口或者Exporter接口,将业务指标作为自定义指标,接入到AOM。 传输存储层 数据传输:AOM Access是用来接收运维数据的代理服务,运维数据接收上来之后,会将数据投放到Kafka队列中,利
可选参数,用于补充说明该委托代理的详细信息。 - 单击“下一步”,进入“授权”页面。 在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页签设置授
通过helm部署pod的yaml文件后,AOM无法检测到工作负载 问题描述 通过helm部署pod的yaml文件后,AOM无法检测到工作负载。 原因分析 通过对比helm部署pod的yaml文件和在CCE控制台部署的pod yaml文件,发现helm部署pod的yaml文件中缺少env参数。
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 实践场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
控的关联数据和高频操作进行集中化展示。 当前仅Prometheus for CCE 实例支持。 表2 监控指标采集 功能 功能说明 指标管理 通过新增ServiceMonitor或PodMonitor的方式为应用配置Prometheus监控的采集规则,来监控部署在CCE集群内的业务数据。
使用“云原生监控(New)”功能,需要接入容器 CCE Prometheus 实例。 若集群还没有接入容器 CCE Prometheus 实例,可以单击页面中的“Prometheus监控”,创建Prometheus实例,详情请参见Prometheus实例 for CCE。创建完成后,单击实例名称,在
在全局设置页面左侧导航栏中选择“采集设置 > UniAgent管理” 在UniAgent安装与配置页面中,选择一个或多个主机,单击“插件批量操作”。 当选择CCE类型主机时,请前往CCE接入页面执行ICAgent插件相关操作。 在弹框中选择操作类型,配置对应的插件信息,并单击“确认”,即可执行对应的操作。 表1
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证:通过Token认证调用请求。 AK/SK认证 AK/SK签名认证方式仅支持消息
AOM控制台的“资源消耗”界面会展示每天指标上报量展示,具体操作请参见统计资源消耗。 如何查看有哪些Prometheus指标? 目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。