检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏单击“指标管理”,在“指标”页签下指标即可查看当前Prometheus实例所有指标的指标名、指标类型等信息。 根据需要删除自定义指标。 废弃一个指标:选择一个指标,单击操作列的。 批量废弃指标:选中一个或多个指标前的复选框,在弹出框中选择“废弃”,可以废弃一个或多个指标。 单次废弃指标最多支持废弃100个指标。
告警管理使用说明 告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。 告警管理使用前提条件:已在主机安装UniAgent,详情请参考“安装UniAgent”,安装之后使用流程请参见图1。
Debugging诊断 概述 线程分析 方法分析 对象分析 父主题: 组件列表
errorType String 错误类型。 error String 错误信息。 请求示例 查询在1630381536时刻的aom_node_status指标(前topk个)。 https://{EndPoint}/v1/{project_id}/aom/api/v1/query?query=topk(2
错误类型。 error String 错误信息。 请求示例 查询在start到end时间范围内每隔step秒的aom_node_status指标(前topk个)。 https://{EndPoint}/v1/{project_id}/aom/api/v1/query_range?query=topk(2
ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: prometheus监控
下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 注意事项 您最多可创建150个告警模板,如果告警模板数量已达到150个,请删除不需要的告警模板后重新创建。 背景信息 AOM针对所有主机和所有服务的关键指标(包括CPU使用率指标、物理内存使用率指标、主机状态
ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: prometheus监控
获取当前Prometheus实例的Remote Read Prometheus配置代码。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for
分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 优势 从周期性、稳定性和自相关性等多维度对数据进行特征提取,自动检测指标异常。 基于应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,全局分析问题。
源状态为正常? 当您在CCE集群中删除了主机或工作负载等资源后,在AOM“主机监控”或“容器监控”界面显示资源状态仍为正常。此为正常现象,这是由于AOM“主机监控”或“容器监控”界面不会立即将资源状态置为已删除,而是会等待30分钟后将已删除的资源状态置为已删除。 非华为云主机安装ICAgent后为何无数据上报?
务页面,修改插件采集任务参数配置。 说明: 修改自定义插件采集任务:可以修改插件版本,以及采集任务详细信息。 修改中间件采集任务:只可修改指标维度信息。 删除采集任务 选择待操作的采集任务,单击对应操作列下的,选择“删除”,在弹出页面中确认后,即可删除采集任务。 父主题: 虚机场景Exporter接入
Write)方式来解决Prometheus存储的可用性和可扩展性场景。 创建Prometheus 通用实例 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”,然后单击“创建Prometheus实例”。 设置实例名称、企业项目,和实例类型信息。 表1 创建Prometheus实例
应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源
概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 使用限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。
Profiler性能分析 概述 Profiler开启 性能分析 对比 快照列表 建议 父主题: 组件列表
虚机场景Exporter接入 接入概述 MySQL组件接入 Redis组件接入 Kafka组件接入 Nginx组件接入 MongoDB组件接入 Consul组件接入 HAProxy组件接入 PostgreSQL组件接入 Elasticsearch组件接入 RabbitMQ组件接入
概述 使用限制 Profiler性能分析,仅针对白名单用户开放。 Alpine Linux系统不支持Profiler功能。因为Alpine Linux是一个轻量级的Linux系统发行版,缺少运行Profiler的必要依赖。如果需要支持Profiler功能,建议使用标准Linux操作系统。
ached运行状态进行监控,以便了解Memcached服务是否运行正常,排查Memcached故障等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控Memcached运行状态。本文为您介绍如何使用Prometheus监控服务Memcached。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。