检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 AOM提供基础运维能力,APM是对AOM运维能力的补充。AOM界
“日志采集开关”默认打开,当不需要采集日志时,可关闭采集开关来停止日志采集,以减少资源占用。 “日志采集开关”关闭后,ICAgent将停止采集日志数据,且云日志服务LTS控制台的“ICAgent采集开关”也将同步关闭,请谨慎操作。 图1 日志采集开关 父主题: 日志配置
通过日志接入和日志搜索功能帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 支持 支持 进程监控 通过配置应用发现规则发现和收集主机上部署的应用和关联的指标,并支持从应用下钻到组件,从组件下钻到实例,从实例下钻到容器。通过各层状态,完成对应用或组件的立体监控。 支持 支持
AOM与CES的云服务监控功能对比 本章节主要对比AOM 2.0的云服务监控与CES的云服务监控功能差异。 AOM的指标数据来源于CES。AOM的指标数据为Prometheus格式,CES为自定义格式。AOM与CES的云服务监控功能对比如表1所示。 表1 AOM的云服务监控与CES的云服务监控功能对比
预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的指标或者计算相对复杂的指标进行提前计算;尤其在大规模
了解 AOM是云上应用的一站式立体化运维管理平台。 产品介绍 什么是AOM 应用场景 与其他服务的关系 约束与限制 指标总览 基本概念 03 入门 快速了解AOM服务在不同应用场景中的操作流程。 快速入门 监控云容器引擎 CCE的指标 05 实践 提供典型场景的最佳实践操作指导您更好地使用AOM。
指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标 AOM支持为主机、组件等多种资源的指标设置阈值告警,具体支持的指标类型可在创建阈值告警规则的页面查看。 更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值
在“云服务接入”页面右侧已接入云服务下单击需要取消接入的云服务卡片,在弹出的对话框中单击“取消接入云服务”。 查看/修改已接入的云服务标签配置 在“云服务接入”页面单击已接入云服务下的云服务卡片,即可修改“接入云服务标签(可选)”的相关设置,具体设置请参见表3。 父主题: 接入AOM
容器过去10秒内的CPU负载的平均值 container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量
ReadOnlyAccess权限的IAM用户,查询命名空间时需要登录云容器引擎 CCE的控制台,在左侧导航栏中选择“权限管理”,单击页面右上角的“添加权限”,单独进行权限设置。 单击右上角的,可获取到3.a设置的时间范围内工作负载的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。
的入口。通过业务层卡片的“接入日志(LTS)简介”链接,查看业务层日志接入LTS的相关操作文档。您可以根据文档完成日志接入LTS相关操作。 接入调用链(APM):AOM提供业务层的调用链接入APM的入口。通过业务层卡片的“接入调用链(APM)”链接,可快速接入业务层调用链。 接入
从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可单击“新建分组规则”添加,具体操作请参见分组规则。 图3 设置告警降噪方式 单击“立即创建”,完成创建。创建了一条阈值规则,单击其前的,可对其下的多个资源的同一指标批量监控。 在展开的列表中,只要某个主机的指标数据满足设
该主机无法解析obs域名,导致无法下载UniAgent的安装脚本。 解决方法 指导用户为Linux系统的ECS主机配置DNS域名解析,并添加安全组,以解决下载UniAgent安装脚本出现域名无法解析问题。 修改ECS主机的DNS配置有两种方式:命令行和管理控制台;您可以根据自己的使用习惯选择其中一种方式进行配置。
驱逐次数(即使未强制执行) 主机因连续返回5xx导致的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_consecutive_gateway_failure 检测到的连续网关故障的驱逐次数 检测到的连续网关故障的驱逐次数(即使未强制执行)。 ≥0
CCI”卡片,可查看支持接入的CCI指标。上报到AOM的CCI指标,详细说明请参见基础指标-虚机指标。 弹性云服务器 ECS 单击“弹性云服务器 ECS”卡片,在弹框中安装Prometheus官方提供的Node Exporter,即可采集Linux类型主机节点的相关信息和运行指标,具体操作请参见配置弹性云服务器
定义页面呈现的内容。例如,通过API接口查询AOM阈值规则,并将数据呈现在通用表格中。如何通过接口查询AOM监控的阈值规则,请参见查询阈值规则列表。 新建转换器。 在使用OpenAPI中alarm的内容时,需要通过转换器将所需的字段转换为您所需要的格式。本示例中,需要将数据转换为数组格式。
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。
alarm period. 无效的限制、指标或者告警周期 请检查对应的参数是否符合要求。 400 SVCSTG_AMS_4000106 Invalid offset, time range, or email. 无效的偏移量、时间范围或者电子邮件 请检查对应的参数是否符合要求。 400
管理采集器底座UniAgent 安装UniAgent 安装UniAgent(新版) 管理主机的UniAgent 管理主机的ICAgent插件 管理CCE集群的ICAgent插件 管理主机组 管理主机组(新版) 配置代理区域和代理机 查看操作日志 父主题: 接入AOM(新版)
e_megabytes) 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) 可用虚拟内存(aom_node_virtual_memory_free_megabytes) 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(MB) 显存容量(aom