检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。 解决方案 AOM通过设置告警规则,实时监控环境中主机、组件等资源使用情况。当产品自身或外部服务存在异常情况时,立即触发告警。并提供告警降噪功能,支持发送告警通知前按告警降噪规则对告
子应用下的创建的组件数量<=50。 环境 组件下可创建的环境数量<=20。 资源 单个环境管理的同类实例资源数量<=2000。 资源监控使用限制 表2 资源监控使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表 1个仪表盘中最多可添加30个图表。
√ 获取资源列表 √ √ 查询节点拓扑关系 √ √ 查询操作记录 √ √ 资源监控常用操作与系统权限 表3列出了资源监控常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表3 资源监控常用操作与系统权限的关系 操作 AOM FullAccess AOM ReadOnlyAccess
创建日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
连续多少个周期不满足告警条件,恢复告警。默认只监控一个周期,最多可监控30个连续周期指标数据。 例如,设置连续周期为“2”,则表示连续2个周期不满足告警条件,恢复告警。 无数据处理 监控周期内无指标数据产生或指标数据不足时系统的处理方式,根据业务需要开启或者关闭。 默认只监控一个周期,最多可监控5个连续周期指标数据。
、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。
当满足以下条件时,您需要按照该方式安装: 该服务器上未安装过ICAgent。 继承安装 当满足以下条件时,您需要按照该方式安装: 您有多个服务器需要安装ICAgent,其中一个服务器已经通过首次安装方式装好了ICAgent,且所有服务器在同一VPC下,可以采用该安装方式。当所有服务器不在同一VPC下,需
ster_name、node、pod、container时,可以跳转至AOM的系统内置仪表盘中查询相应时间的指标曲线。 规则类型为应用性能监控的告警规则触发的告警:单击告警详情页的应用、组件、环境,可跳转至组件指标项详情页。 查看已清除告警 在右上角单击“活动告警”,在下拉列表中选择“历史告警”,可查看被清除的告警。
直连接入(内网):华为云主机,使用直连接入(内网)的方式。 直连接入(公网):非华为云主机,使用直连接入(公网)的方式。 代理接入:通过选择已配置代理机的代理区域,使用代理接入的方式远程安装UniAgent。如果选择了“代理接入”,还需选择代理区域。代理区域中的代理机必须为一台已经安装了U
如果已知资源使用情况,需了解价格预算和计费方式选择,可前往价格计算器预算价格。 计费模式 AOM当前提供按需计费模式,按需计费是一种后付费模式,即先使用再付费,按照云服务器实际使用时长计费。关于按需计费模式的详细介绍请参见计费模式概述。 计费项 AOM的计费项由自定义指标上报量、指标存储时长、数据转储量的费
通过ECS验证到AOM域名的连通性。 登录弹性云服务器 ECS控制台。 在左侧导航栏中选择“弹性云服务器 > 弹性云服务器”。 单击弹性云服务器名称,进入弹性云服务器的“基本信息”页签。 检查弹性云服务器中的“虚拟私有云”与步骤一购买终端节点时选择的虚拟私有云是否一致。 若一致,则继续后续操作。
增的主机。 单击“添加”,完成配置。AOM会采集进程的指标数据。 等待大约两分钟后,您可在左侧导航栏中选择“监控 > 组件监控”,在集群下拉列表框中选择主机,找到已被监控的组件。 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明
“指标采集开关”用来控制是否对指标数据进行采集(自定义指标除外)。“告警消息内容显示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 指标配置”。 根据需要开启或者关闭“
该指标用于统计主机本地时间与NTP服务器时间的偏移量,NTP偏移量越接近于0,主机本地时间与NTP服务器时间越接近。 - 毫秒(ms) aom_node_ntp_server_status NTP服务器状态 该指标用于统计主机是否成功连接上NTP服务器。 0、1 0表示已连接 1表示未连接
图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。
目前仅default类型、CCE类型、云服务类型的Prometheus实例支持指标查看功能。 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击目标Prometheus实例的名称,进入该实例的详情界面。 在左侧导航栏单击“指
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 如何获取AK/SK? ICAgent安装类常见问题 如何创建终端节点? 如何启用NGINX stub_status模块? APM指标数据未采集上来,可能有哪些原因? ECS主机上执行UniAgent安装命令,下载安装脚本失败
志数据满足设置的告警条件,产生日志告警。 告警规则分为指标告警规则、事件告警规则、日志告警规则以及应用性能监控告警。通常情况下,通过指标、日志和应用性能监控告警规则,实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件告警规则,简化告警通知,快
一个虚机最多可配置20条日志采集路径。 同一资源空间下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源空间下,LTS中所有ECS主机的采集配置都失效。 配置日志采集路径 登录AOM