检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询时间序列 场景描述 本章以查询一个节点的CPU使用率时间序列为例。 涉及的基本信息 查询时间序列前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 CPU使
查询时序数据 场景描述 本章以查询一个节点的CPU使用率时序数据为例。 涉及的基本信息 查询时序数据前,需要确定节点的ID和集群ID的值,节点ID值可以在ECS的dimensions中查看,集群ID值可以在CCE的“集群管理”页面,基本信息的dimensions中查看。 因指标格
ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息 问题描述 ICAgent安装成功后,AOM无法监控到CPU内存使用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。
单击“快照列表”,进入快照列表页面。 在Profiler页签选择您想要查看的实例,可以查看该实例对应的性能分析数据。 图1 快照列表 表1 快照列表参数说明 参数 说明 日期 获取调试信息的时间。 CPU核数 CPU利用率。 内存分配速率 内存的速度,它代表着该内存所能达到的最高工作频率。
aom_node_cpu_limit_core CPU内核总量 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) aom_node_cpu_used_core CPU内核占用 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_node_cpu_usage
> 接入中心”。 在“Prometheus 运行环境”面板单击“ECS Node Exporter”卡片。 “ECS Node Exporter”卡片当前仅华北-北京四卡片改名为“弹性云服务器 ECS”。 在“ECS Node Exporter”弹框中的“安装步骤”页签,按照页面提示进行安装。
查看桶日志 桶日志是AOM提供的一种细粒度日志查询功能,您可以日志桶为单位查看日志,以便提取关键业务数据、快速查看并定位问题。 目前对于华北-北京一、华东-上海二和华南-广州区域,桶日志支持多维度日志信息查询和检索,您可对原始日志进行查询与分析,也可对结构化后的日志进行SQL查询与分析。
类型 性能问题类型,目前只有cpu类型,后期内存,时延类型会依次上线。 性能问题 具体的性能问题的描述。 调用方法 当前问题出现的方法名。 问题出现数 在查询的时间范围内,当前性能问题出现的次数。 CPU使用率 当前问题最后一次出现,所使用的资源(cpu)的使用率。 操作 支持的其他操作类型,目前仅支持“查看详情”。
组件监控(CPU&内存)卡片 图4 组件监控(CPU&内存)卡片 此卡片主要展示了4种信息: 统计最新时间前1分钟内的组件的CPU使用率、内存使用率在TOP5的组件信息。 最近1小时内的所选组件的CPU使用率、内存使用率的趋势图,趋势图的每一个点分别表示1分钟内组件CPU&内存使用率的值。
签。 依次在下拉框选择“日志组名称”和“日志流名称”。 在SQL查询条件框中输入SQL语句,单击“查询”即可查看该日志流下日志数据分析。目前支持的SQL语句详见SQL查询语法。 依照业务需求选择不同图表类型,呈现查询结果。图表类型与配置的详细说明请参见日志数据类图表。 单击:以表格形式展示当前日志数据。
析页签。 图1 性能分析 在Profiler页签选择您想要查看的实例、性能分析类型、范围以及聚合维度,可以查看该实例对应的性能分析数据。 表1 性能分析参数说明 选择项 参数 说明 类型 CPU Time 每个方法在CPU上的运行时间。 类型 Memory 每个方法分配的堆内存大小。
Agent安装成功后,大概需要5分钟,您即可在“日志 > 日志路径”的虚机列表中查看到您的虚机。 注意事项 AOM日志采集路径配置的虚拟机列表,只展示操作系统为Linux的弹性云服务器或裸金属服务器。 若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*
资源类型:Host,即可查询出指定时间范围内资源类型为“Host”的事件。 事件源 支持选择事件源进行搜索。 事件源源:AOM,即可查询出指定时间范围内告警源为“AOM”的事件。 事件关键字 支持按事件名称 、 事件源源、资源类型等事件关键字进行模糊查询。 搜索框的筛选条件设置为“事件关键字”,然后输入关键字信息。
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。
告警故障已经解除时可进行清除操作。 查看告警详情 单击告警名称可查看告警详情,包括告警信息和修复建议,如果在创建告警规则时关联了告警行动规则或告警降噪规则,还可查看行动规则或告警降噪规则相关信息。 说明: 在“告警信息”页签下单击告警规则、日志组、日志流等蓝色字体可下钻到具体详情页面,查看更详细的数据。
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 查看事件 在左侧导航栏中选择“告警 > 事件列表”。 在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围:
> 日志文件”,单击“主机”页签,查看采集到的日志文件。详细操作请参见查看日志文件。 查看虚机日志并进行分析 在左侧导航栏中选择“日志分析 > 日志搜索”,单击“主机”页签,通过时间范围、关键字、上下文等方式查看采集到的日志并进行分析。详细操作请参见搜索日志。 父主题: 日志分析(旧版)
取值范围 单位 CPU内核总量(aom_node_cpu_limit_core) 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_node_cpu_used_core) 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core)
查看日志文件 您可快速查看组件实例的日志文件,以便定位问题。 查看日志文件 在左侧导航栏中选择“日志 > 日志文件”。 在“日志文件”页面选择“组件”或“主机”页签并单击名称,在页面右侧的日志文件列表中即可查看其实例的日志文件名称、最新写入时间。 单击该实例“操作”列的“查看”,
示例二:集群下指定pod占所在节点(不含控制节点)的cpu使用率 定义变量: pod中容器的cpu实际使用量:aom_container_cpu_used_core node的cpu实际总量:aom_node_cpu_limit_core 查询逻辑: 针对指标aom_container_cpu_used_core