应用运维管理 AOM-资源监控

时间:2023-12-07 16:07:42

资源监控

在使用资源监控时,您需注意以下使用限制,详见表1

表1 资源监控使用限制

分类

对象

使用限制

仪表盘

仪表盘

1个区域中最多可创建1000个仪表盘。

仪表盘中的图表

1个仪表盘中最多可添加30个图表。

仪表盘中图表可选资源、阈值规则、组件或主机的个数

  • 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。
  • 1个阈值状态图表最多可添加10个阈值规则。
  • 1个主机状态图表最多可添加10个主机。
  • 1个组件状态图表最多可添加10个组件。

指标

指标数据

  • 基础规格:指标数据在数据库中最多保存7天。
  • 专业规格:指标数据在数据库中最多保存30天。

指标项

资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。

维度

每个指标的维度最多为20个。

指标查询接口

单次最大可同时查询20个指标。

统计周期

最大统计周期为1小时。

单次查询返回指标数据

单个指标单次查询最大返回1440个数据点。

自定义指标

无限制。

上报自定义指标

单次请求数据最大不能超过40KB,上报指标所带时间戳不能超前于标准UTC时间10分钟,不接收乱序指标,即有新指标上报后,旧指标上报将会失败。

应用指标

JOB指标

  • 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“ICAgent停止采集应用指标”告警(告警ID:34105)。
  • 每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。

由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。

采集器资源消耗

采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。

告警规则

告警规则

告警规则(包含指标告警规则和事件告警规则)最多可创建3000个。

告警模板

告警模板最多可创建150个。

日志

日志功能限制

日志功能限制请参考LTS日志限制

日志文件

只支持采集文本类型日志文件,不支持采集其他类型日志文件(例如二进制文件)。

每个通过卷挂载日志的路径下,ICAgent最多采集20个日志文件。

每个ICAgent最多采集1000个容器标准输出日志文件,容器标准输出日志只支持json-file类型。

采集日志文件的资源消耗

日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。

日志丢弃

当单行日志长度超过10240字节时,此行会被丢弃。

日志采集路径

Linux

  • 采集路径支持递归路径,**表示递归5层目录。示例:/var/logs/**/a.log。
  • 采集路径支持模糊匹配,匹配目录或文件名中的任何字符。示例:/var/logs/*/a.log、/var/logs/service/a*.log。
  • 采集路径如果配置的是目录,示例:/var/logs/,则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。
  • 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。

Windows

  • Windows环境日志采集路径支持递归路径,**表示递归5层目录。配置样例:C:\var\service\**\a.log。
  • Windows环境日志采集路径支持模糊匹配,匹配目录或文件名中的任何字符。配置样例:C:\var\service\*\a.log、C:\var\service\a*.log。
  • 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。
  • windows事件日志采集不能重复配置,即同一主机下,即使跨日志组和日志流,也只能配置一次。

日志重复

当采集器被重启后,重启时间点附近可能会产生一定的数据重复。

历史日志

日志数据存储时长与您选择的版本有关,且收费不同,详见价格详情

告警列表

告警

您最多可查询最近31天的告警。

事件

您最多可查询最近31天的事件。

-

应用发现规则

应用发现规则最多可创建100个。

support.huaweicloud.com/productdesc-aom2/aom_01_0015.html