检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。 解决方案 AOM通过Prometheus监控功能,创建多账号聚合实例,并接入账号、云服务与云服务相关指标,支持在“指标浏览”界面同时监控多个成
InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。建议直接修改该请求,不要重试该请求。 错误码 请参见错误码。 父主题: 日志
填告警行动策略id 当notification_enable为false时,填“” notify_resolved Boolean 告警解决是否通知。 true:通知 false:不通知 枚举值: true false notify_triggered Boolean 告警触发是否通知。
基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring/coredns/0
户的体验,如果无法及时获知,就会导致流失大量用户,某商城的运维人员使用开源的监控软件,虽然能采集很多指标,但却分散在各处,无法统一展示。 解决方案 AOM能够实现云上应用的一站式立体化运维管理,在接入中心中可以接入需要监控的业务层、应用层、中间件层、基础设施层指标,在仪表盘中实现
修改安装机名称 当主机已设置了安装机,通过如下操作可以修改安装机的名称。 单击安装机名称,在弹出的对话框中重命名安装机的名称。 安装时遇到的问题和解决方法 如果您在安装UniAgent时遇到问题,请参考常见问题处理。 父主题: 管理采集器底座UniAgent
AOM提供应用接入功能,可以为部署在CCE容器中的JAVA应用安装APM探针Agent,来监控JAVA应用,以提供更精准的问题分析与定位,协助您高效解决应用难题。 前提条件: 部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telne
修改安装机名称 当主机已设置了安装机,通过如下操作可以修改安装机的名称。 单击安装机名称,在弹出的对话框中重命名安装机的名称。 安装时遇到的问题和解决方法 如果您在安装UniAgent时遇到问题,请参考常见问题处理。 父主题: 管理采集器底座UniAgent
告警行动策略id 当notification_enable为false时,填“” notify_resolved 否 Boolean 告警解决是否通知。 true:通知 false:不通知 枚举值: true false notify_triggered 否 Boolean 告警触发是否通知。
集群指标及其维度 集群指标由AOM通过主机指标汇聚,汇聚的集群指标不包含master节点的主机指标。 表1 集群指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_cluster_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core)
标准输出配置 通过添加指定采集容器标准输出标签,用户可以指定采集pod下的对应容器名的标准输出日志。用户在pod的yaml中spec:template:metadata:annotations:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout:
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格
普罗语句说明 AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。 普罗语句语法 普罗语句语法详情可登录prometheus官网查看。
订阅AOM指标或告警数据 AOM支持用户订阅指标或者告警信息。订阅后可以将数据转发到用户配置的DMS或Webhook的Topic中,供消费者消费转发订阅的信息。 约束与限制 最多可创建10个数据订阅规则。 Webhook订阅类型当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
添加自定义标签字段 添加自定义标签字功能目前仅在华东-上海一开放。 通过添加自定义标签,用户可以在日志页面上查看到自定义标签,如果将aom日志接入lts后,可以通过该自定义标签关键字进行日志搜索。 编辑yaml:通过在工作负载的yaml中spec:template:metadat
查询任务列表 功能介绍 该接口可返回已经创建的任务列表,可按任务名称,任务状态,任务类型,执行人,更新时间为查询条件分页查询任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/cms/workflow-list 表1 路径参数 参数 是否必选
搜索日志流中的日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,还可通过分析日志的来源信息和上下文原始数据快速定位问题。 约束与限制 如需使用“日志流”功能,需提前在“菜单开关”中开启日志流的开关,详细操作请参见菜单开关。 使用日志分析(新版)功能的区域没有日志流功能。