检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品架构 AOM是一个以资源数据为中心并关联日志、指标、资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集
主机安装ICAgent,否则AOM将无法监控)。同时,主机的IP地址支持IPv4。 通过主机监控功能您可以及时了解主机的资源使用情况、趋势和告警信息,使用这些信息,您可以快速响应和处理异常,保证主机流畅运行。 约束与限制 一个主机最多可添加5个标签,且标签键不能重复。 不同主机可添加同一个标签。
process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。 node_intr_total 节点中断总数 node_load1 节点1分钟CPU负载
免费体验AOM服务 在华为云学院沙箱实验室,您可以免费体验AOM服务,完成电子商城网站应用的一站式运维。体验地址: 使用AOM实现云端应用一站式运维。
随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题
用于对查询到的时序数据进行断点插值,默认值为-1。 -1:断点处使用-1进行表示。 0 :断点处使用0进行表示。 null:断点处使用null进行表示。 average:断点处使用前后邻近的有效数据的平均值进行表示,如果不存在有效数据则使用null进行表示。 请求参数 表3 请求Body参数
用于对查询到的监控数据进行断点插值,默认值为-1。 -1:断点处使用-1进行表示。 0 :断点处使用0进行表示。 null:断点处使用null进行表示。 average:断点处使用前后邻近的有效数据的平均值进行表示,如果不存在有效数据则使用null进行表示。 缺省值:-1 枚举值: -1 0
资源分组 AOM支持按企业项目以及资源细粒度对资源进行分类管理,帮助用户快速管理和使用资源。 资源分组最多可以创建100个。 创建资源分组 在左侧导航栏中选择“资源分组”,可查看资源分组的信息。 单击右上角的“创建资源分组”。 根据界面提示配置参数,具体如表1所示。 表1 配置参数
接入应用层指标 中间件指标 通常来源于原生中间件或云中间件数据。 文件系统容量、文件系统使用率等 接入中间件指标 基础设施层指标 通常来源于容器或云服务相关数据,例如计算、存储、网络、数据库等。 CPU使用率、内存使用率、健康状态等 接入基础设施层指标 接入容器指标 接入云服务指标 图1 AOM四层指标体系
在Prometheus实例详情页面的“指标管理”中不能废弃以aom_prom_fixed_作为前缀的指标,且该指标上报到AOM时会收费。 原因分析 当用户使用普罗函数(例如:"count"、"max"、"min"、"avg"、"sum"、"count_values"、"stddev"、"stdv
ICAgent安装完成后,界面“ICAgent状态”为“离线”。 问题分析 原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss
accesscode与projectid有对应关系,请在填写时确认匹配关系。 图5 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图6 配置完成 父主题: 接入管理
auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成后,单击“Save&Test”,验证是否配置成功。 配置成功即可使用Grafana配置Dashboards,查看指标数据。 图5 配置完成 父主题: Prometheus监控
法:{{维度名}}。如果图表中图例显示为{{维度名}},表示该指标没有对应的维度。例如:{{hostname}} 将使用维度hostname的值替换为图例值。使用数字图,表格,数字折线图时不支持配置“图例格式化”。 指标数据配置完成后,可单击“新增指标”,多次添加指标数据,最多可添加100条指标数据。
的“远程登录”,根据界面提示以root用户登录ECS。 图1 远程登录ECS 执行ICAgent安装命令。 在ECS桌面单击“复制粘贴”,使用快捷键“Ctrl+V”将3中已复制的ICAgent安装命令粘贴至窗口中并单击“发送”,将复制的ICAgent安装命令发送至命令行窗口,如下
aom_node_gpu_memory_usage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_node_gpu_memory_used_megabytes 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage
调用失败响应信息描述。 最小长度:1 最大长度:1024 http_code Integer http返回码 最小值:0 最大值:999 请求示例 使用任务名称为"xxx"、模板名称为"CMS::ECS::BulkyStartECSInstances"、输入参数为"input"来创建启动ECS任务。
Nginx指标接入AOM 您可以直接使用AOM提供的Nginx Exporter插件给主机创建采集任务,并安装Nginx Exporter插件,就可以监控Nginx相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 已启用NGINX
RabbitMQ指标接入AOM 您可以直接使用AOM提供的RabbitMQ Exporter插件给主机创建采集任务,并安装RabbitMQ Exporter插件,就可以监控RabbitMQ相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。
Kafka指标接入AOM 您可以直接使用AOM提供的Kafka Exporter插件给主机创建采集任务,并安装Kafka Exporter插件,就可以监控Kafka相关指标。 前提条件 主机已安装UniAgent,且状态为运行中。 已创建ECS Prometheus实例。 配置Kafka指标接入AOM