检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单次创建告警规则可选择的被监控对象数 5000 不限制,支持全部资源、正则匹配、精准匹配。 聚合告警 不支持 支持基于PromQL语法的聚合告警,例如:按CDN总带宽、EIP总带宽和OBS存储等条件聚合告警。 对接线下Grafana 不支持 支持以Prometheus数据源的方式直接对接到线下Grafana。
创建分组规则 使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并
ge)、函数工作流(FunctionGraph)和微服务引擎(Cloud Service Engine,CSE)等上层运维服务采集指标数据并实时、可视化呈现。 可观测性分析 基于四层指标体系(基础设施层指标、中间件层指标、应用层指标和业务层指标),通过事务监控、容器监控、普罗监控
制台查看。您可以通过在AOM控制台添加接入规则来创建映射,映射创建后,即可通过LTS查看和分析AOM日志。 图1 未创建映射 创建日志流A并创建接入规则后,即已创建AOM至LTS的映射,最新的AOM日志将上报至日志流A,AOM可以查看映射前后所有的日志数据,日志流A不会复制或移动
示吞吐量和整体时延。吞吐量即所选时间的调用次数。拓扑使用Apdex对应用性能满意度进行量化,并使用不同颜色对不同区间Apdex的值进行标识,方便您快速发现问题,并进行定位。 图2 拓扑图 事务 现实生活中,事务即一次任务,您使用应用完成一项任务,比如电商应用程序中一次商品查询就是
通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。具体操作请参见:接入云服务指标。 API开源协议及其他 表6 API开源协议及其他 卡片 说明 应用运维管理AOM API 使用AOM的OPEN API上报指标数据。具体操作请参见:接入指标(AOM)。 云日志LTS API 使用LTS的OPEN
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。 添加AccessCode。 登录A
组分类。 组件 构成应用的最小单元,可以理解为应用程序或者应用依赖的一个中间件云服务组件,例如RDS,DMS。组件一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境 用于区分一个组
Bps。 近30分钟CPU及内存使用率数据的趋势图,趋势图的每一个点分别表示1分钟内所选应用的CPU使用率以及内存使用率。趋势图上方的值为最新时间点所选应用的CPU使用率和内存使用率。 告警统计卡片 图3 告警统计 此卡片主要统计展示告警、日志使用量、阈值规则、告警和主机数量趋势图的数据。
清理磁盘空间 使用清理磁盘空间原子服务场景创建任务后,您可以对ECS虚拟机的指定目录进行磁盘清理,释放内存。 前提条件 ECS实例均已成功安装UniAgent,并且UniAgent的状态为运行中。 创建清理磁盘空间任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。
切换版本”进行切换操作。您需要注意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
将Prometheus的数据上报到AOM 如果您已经部署并正在使用开源prometheus,可直接进行步骤三。 本章主要介绍通过部署Prometheus将AccessCode配置到Prometheus的配置文件并使之生效。 前提条件 已购买弹性云服务器ECS。 操作步骤 安装并启动Prometheus,具体
其他组件接入 操作场景 您可以使用自定义Exporter创建采集任务,可以监控该组件的相关指标,并通过Exporter上报数据库指标,用于异常报警和Grafana监控大盘展示。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤
完成某项业务的最小工作单元(可以是微服务、容器进程或者普通进程)。 应用: 一个完整的业务模块,由多个组件组成。 在配置完应用发现之后,可以使用AOM监控应用的各项指标,关联应用对应的资源告警等,主要特性与场景如下: 提供应用与组件、组件与组件实例、应用与主机的关联关系。 提供组件与日志的关联搜索能力。
ID):访问密钥ID,是与私有访问密钥关联的唯一标识符。访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。 操作步骤 登录控制台,将鼠标移动到右上方的用户名称,并在下拉列表中选择“我的凭证”。
通过华为云标签(Tag)分发告警 通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。 实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM通过
将光标移至待操作的应用名称后,单击,选择“删除”。 搜索应用信息 在“应用管理”页面的左侧区域,可以按企业项目、应用、区域、标签、关键字等搜索并展示需要的应用。 查看应用信息 选中一个应用,在右侧区域单击“应用信息”页签。 父主题: 应用管理
计费模式概述 AOM支持按需计费方式。按照用户实际使用的自定义指标上报量、指标存储时长、数据转储量计费。先使用,后付费。 按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。 父主题: 计费模式
Nginx组件接入 操作场景 您可以直接使用AOM内置的Nginx插件来创建采集任务,通过快捷安装配置Nginx插件,就可以监控Nginx相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 已启用NGINX stub_status模块。
Consul组件接入 操作场景 您可以直接使用AOM内置的Consul插件来创建采集任务,通过快捷安装配置Consul插件,就可以监控Consul相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 操作步骤 登录AOM 2