检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看组件异常日志 异常监控项是对应用的异常日志进行监控。例如java的日志异常监控,一旦用户采用log系统打印日志,就会被采集上来。具体的异常采集类型会根据不同的采集器类型有变化。 查看组件异常日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的
基本概念 指标 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 其中,命名空间特指指标的命名空间,可将其理解为存放指标的容器,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地聚合到相同的统计信息中。维度是指标的分类,每个指标都包含用于描述该指标的特定特征
计费项 计费说明 AOM提供按需计费模式,计费项由自定义指标上报量、指标存储时长、数据转储量的费用组成。具体内容如表1所示。AOM 2.0仅对上报的自定义指标计费。对上报任意数量的基础指标都是免费的,基础指标请参见:基础指标。 表1 按需计费组成表 计费项 计费说明 计费公式 自定义指标上报量
快速分析日志流中的日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息
查看组件远程过程调用监控项 远程过程调用监控项可以对组件的远程过程调用进行监控。 查看组件远程过程调用 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称
修改ECS非管理员密码 使用修改ECS非管理员密码卡片可以修改非管理员用户的密码。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建修改ECS非管理员密码任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“
查看组件消息队列监控项 消息队列监控项可以对消息队列的访问进行监控,可以监控的消息队列包含KafkaProducer等类型。 查看组件消息队列 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”
自动化运维 表1 自动化运维基本概念 术语 说明 脚本管理 支持Shell、Python、Bat、Powershell脚本语言以及单个脚本的多版本管理。 作业管理 将脚本和文件原子操作进行多步骤编排形成作业模板,用于完成特定运维自动化场景操作。例如初始化业务环境。 执行方案 从作业模板中挑选
500 AOM.32000016 Database operation failed. 数据库操作异常。 请联系技术支持工程师解决。 500 AOM.32000023 The Agent is abnormal. agent状态异常。 请联系技术支持工程师解决。
运维管理概述 自动化运维服务依托华为云UniAgent运维通道的能力,提供批量脚本执行、文件分发、云服务变更等原子操作功能,支持自定义编排原子操作并组装成作业和标准化运维流程。自动化运维将日常运维操作沉淀并发布成服务,实现日常变更的标准化、自动化、无差异化运维,将运维工作从日常重复繁杂的应用变更操作中解脱出来
Prometheus监控 Prometheus监控概述 管理Prometheus实例 管理Prometheus实例指标数据 使用Prometheus监控CCE集群指标 配置多账号聚合实现指标统一监控 配置CCE集群监控采集指标规则 配置预聚合规则提升指标查询效率 配置数据多写实现监控指标转储到自建
通过AOM监控工作负载 工作负载监控是针对CCE、CCI工作负载的监控,通过工作负载监控您可以及时了解工作负载的资源使用、状态和告警等信息,以便快速响应处理告警或事件信息,保证工作负载顺畅运行。工作负载分为五种类型:无状态负载 Deployment、有状态负载 StatefulSet
prometheus监控 GET方法查询区间数据 (推荐)POST方法查询区间数据 GET方法查询瞬时数据 (推荐)POST方法查询瞬时数据 查询标签值 GET方法获取标签名列表 (推荐)POST方法获取标签名列表 元数据查询 父主题: API
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
通过AOM告警分组规则清除ELB告警风暴 本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 应用场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多
Prometheus监控 “√”表示支持,“x”表示暂不支持。 表1 prometheus监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理
接入管理 概述 将Prometheus的数据上报到AOM 通过grafana查看AOM中的指标数据 父主题: 配置管理
Prometheus监控 如何将Prometheus数据接入到AOM? 如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 如何获取Prometheus实例的服务地址? 不能废弃以aom_prom_fixed作为前缀的指标