检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在仪表盘页面选择实例类型为“Prometheus for CCE”的实例并单击“添加图表”,详情请参见添加图表至仪表盘。 配置告警 登录AOM 2.0控制台。 在左侧菜单栏中选择“告警管理 > 告警规则”。
具体操作请参见:Prometheus实例 for 云服务。 API开源协议及其他 表6 API开源协议及其他 卡片 说明 应用运维管理AOM API 使用AOM的OPEN API上报指标数据。具体操作请参见:接入指标(AOM)。
单击“组件”列,某一个组件名称,进入该组件指标项详情页,默认展示“接口调用”页签中“全部实例”的“URL监控”信息。 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。
系统指标维度:维度是固定不变的,不同类型的指标维度不同,维度信息请分别参见后续章节。 自定义指标维度:维度为1~32位的字符串,需要您自定义。 父主题: 指标总览
资源绑定:将资源对象与应用下的环境建立关联关系,在同一个应用下资源对象实例可属于多个环境。 资源解绑:关联资源后,当组件或环境信息变化,不需要资源时,可将资源从原应用节点解除绑定。
Prometheus实例:包括所有Prometheus实例相关接口对应的授权项,例如卸载托管Prometheus实例接口。 应用资源管理:包括所有应用资源相关接口对应的授权项,例如新增应用接口。 自动化运维:包括所有自动化运维相关接口对应的授权项,例如创建任务接口。
在“监控视图”页签下,选择对应的Prometheus实例,可查看该应用的资源使用情况。单击页面右上角的,可全屏展示资源信息。 在“告警”页签下,可查看该应用的告警详情,详情请参见查看告警。 父主题: 进程监控
/ 数据订阅 AOM支持客户配置数据订阅,把客户的指标和告警数据发送到客户指定的DMS实例中,客户可以自由处理转储出来的这部分数据。 数据订阅 父主题: 安全
kubelet_certificate_manager_client_ttl_seconds Kubelet客户端证书的TTL kubelet_cgroup_manager_duration_seconds_bucket 控制组管理器操作的持续时间bucket kubelet_cgroup_manager_duration_seconds_count
“ECS Node Exporter”卡片当前仅华北-北京四卡片改名为“弹性云服务器 ECS”。 Prometheus 云服务接入 通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。 ModelArts服务默认自动将指标上报到AOM,其指标数据开箱即用。
选填 实例 调用链所在实例。 选填 URL 调用链的URL,分为Rest URL和Real URL两种搜索条件:Rest URL为restful风格的URL,URL中带有变量名称,如/apm/get/{id};Real URL为实际访问的URL。
例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。
/ 数据订阅 AOM支持客户配置数据订阅,把客户的指标和告警数据发送到客户指定的DMS实例中,客户可以自由处理转储出来的这部分数据。 数据订阅 父主题: 安全
Prometheus监控 提供实例列表、资源消耗功能。 实例列表 Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,可灵活扩展云原生组件指标插件。
管理Prometheus实例 配置预聚合规则 指标管理 仪表盘监控 接入指南 获取Prometheus实例的服务地址 通过Grafana查看Prometheus实例数据 通过Remote Read方式读取Prometheus实例数据 自建Prometheus数据上报到AOM 统计资源消耗
单击某个实例名称,可查看对应实例的指标、告警、日志等信息。 在“概览”页签,展示环境指标以及应用层和基础设施类信息。 在“日志”页签,可以查看该环境的原始日志、实时日志详情和进行日志可视化分析,详情请参见日志流。
当一个应用在机器上部署多个实例,可以通过instanceName来区分,比如7001或者8001两个端口实例。这种实际情况下很少发生,一台机器部署多个java实例往往是不同的应用程序,相同应用程序的部署两个实例很少见。
图4 TopN接口错误率突增 应用服务整体流量不均:基于应用下所有实例的流量数据,展示应用下最大流量和最小流量实例的流量和时延数据,并展示应用下流量Top5的接口在最大流量和最小流量实例上的分布,快速定位受影响接口。单击所展示的接口,可详细追踪接口近期的调用情况。
图8 TopN接口错误率突增 应用服务整体流量不均:基于应用历史1小时数据,判断最近15分钟应用的所有实例是否出现流量不均的情况。 图9 应用服务整体流量不均 父主题: 智能洞察(BETA)
Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 Prometheus探针 部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。