检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
http://localhost:9216/metric 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
http://localhost:9216/metric 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案
http://localhost:9114/metric 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
/metrics 图3 执行命令 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
/metrics 图3 执行命令 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧菜单栏中选择“Prometheus监控 > 实例列表”。
通过多账号聚合Prometheus实例实现指标数据统一监控 本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多
总览”。 总览 崩溃 崩溃页面展示App监控的“崩溃”信息,包括该应用下的总崩溃次数、设备崩溃率、影响设备数、影响版本数、崩溃总览趋势图、TOP5版本崩溃、TOP5设备崩溃以及崩溃列表。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控 > 崩溃”。 登录APM控制台。 在左侧导航栏选择“App监控
的指标。 日志配置 提供日志配额和分词设置功能。 配额配置 当指标超过配额时,时间较早的指标将会被删除。 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 指标配置 指标采集开关用来控制是否对指标数据进行采集(SLA指标、自定义指标除外)。 使用流程 AOM使用流程如下图所示。
阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至告警条件上方的图表区,会浮动显示当前指标的ID、IP、单位等信息。 告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复
查询系统中已有服务发现规则 功能介绍 该接口用于查询系统当前已存在的服务发现规则。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数 参数 是否必选 参数类型 描述 project_id
阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。 将光标移动至告警条件上方的图表区,会浮动显示当前指标的ID、IP、单位等信息。 告警级别 阈值告警的级别,包括:紧急、重要、次要、提示。 高级设置 告警恢复
添加或修改服务发现规则 功能介绍 该接口用于添加或修改一条或多条服务发现规则。同一projectid下可添加的规则上限为100条。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/inv/servicediscoveryrules 表1 路径参数
概述 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动化运维方案,支持快速从云端、本地采集指标、日志和性能数据,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行
yaml查询到Postgres实例启动时间指标。 图1 访问地址 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
yaml查询到Postgres实例启动时间指标。 图1 访问地址 配置CCE集群指标采集规则 通过“新增PodMonitor”方式为应用配置可观测监控Prometheus版的采集规则,监控部署在CCE集群内的应用的业务数据。 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。
gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0
条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将
云上应用延伸到边缘的能力,联动边缘和云端的数据,满足客户对边缘计算资源的远程管控、数据处理、分析决策、智能化的诉求,同时,在云端提供统一的设备/应用监控、日志采集等运维能力,为企业提供完整的边缘和云协同的一体化服务的边缘计算解决方案。 AOM提供对IEF资源的运维能力,无需额外安
条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对应告警条件后,还可以根据需要执行以下操作: 单击告警条件后的,可将对应行的指标数据在当前图表中隐藏。 单击告警条件后的,可将