统计图表说明 仪表盘功能支持通过统计图表的方式将指标数据、日志数据的查询和分析结果进行可视化展示,支持的图表类型有折线图、数字图、状态图等。 指标数据类图表 指标数据类图表支持的图表类型:折线图、数字图、TopN、表格、柱状图、数字折线图。
0~100 百分比(%) 显存已使用量(aom_cluster_gpu_memory_used_megabytes) 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。
0~100 百分比(%) 显存使用量(aom_node_gpu_memory_used_megabytes) 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_node_gpu_usage) 该指标用于统计测量对象的GPU使用率。
≥0 兆字节(MB) GPU使用率(aom_container_gpu_usage) 该指标用于统计测量对象的GPU使用率。
统计图表说明(新版) 仪表盘功能支持通过统计图表的方式将指标数据、日志数据的查询和分析结果进行可视化展示。 指标数据类图表 指标类图表支持选择的图表类型有:折线图、数字图、TopN、表格、柱状图、数字折线图。
gpuName GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 hostName 主机名称。 集群指标 clusterId 集群ID。
gpu图形处理器频率 cce_gpu_video_clock gpu视频处理器频率 cce_gpu_temperature gpu温度 cce_gpu_power_usage gpu功率 cce_gpu_total_energy_consumption gpu总能耗 cce_gpu_pcie_link_bandwidth
0~100 百分比(%) aom_node_gpu_memory_used_megabytes 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage GPU使用率 该指标用于统计测量对象的GPU使用率。
图1 添加指标图表 表3 添加指标图表 参数名称 说明 图表标题 图表的标题,用于区分不同的指标图表。图表标题支持通过变量填充来动态过滤图表信息,且支持标题重复。 最多可输入255个字符,不能包含特殊字符"$#%&'+;<=>?
图表类型 指标图表可选择的图表类型,包括:折线图、数字图、表格、柱状图、数字折线图、饼图、地图。 图表配置 在页面右侧单击图表类型后的向下箭头,从下拉列表中选择合适的图表类型,并设置图表的配置参数,例如X轴名称、Y轴名称及显示数值等,配置参数的说明具体请参见日志数据类图表。
应用运维管理-成长地图 | 华为云 应用运维管理 应用运维管理(简称AOM)是云上应用的一站式立体化运维管理平台,实时监控应用及云资源,采集各项指标、日志及事件等数据分析应用健康状态,提供告警及数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。
≥0 兆字节(MB) aom_node_gpu_usage gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。
GPU温度 表示GPU温度。
图6 参数与界面对应关系图1(仅供参考) 图7 参数与界面对应关系图2(仅供参考)
workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS日志黑名单功能,更改容器指标来源为working_set 5.12.96 新增云资源发现类型 5.12.90 更新gpu
仪表盘功能支持导入Grafana视图吗? 问题描述 仪表盘功能支持导入Grafana视图吗? 解决方法 如果想通过AOM仪表盘导入Grafana视图,建议用户先获取Grafana视图的普罗语句,然后在AOM中通过“按普罗语句添加”方式创建仪表盘图表。
添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件,AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware.wrapper.WrapperSimpleApp
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。
单击实例名称,可查看进程的监控视图与告警信息。 在“主机列表”页签,可查看该组件所在的主机概况。 在“监控视图”页签下,选择对应的Prometheus实例,可查看该组件的资源使用情况。单击页面右上角的,可全屏展示资源信息。
通过拓扑图查看组件间调用关系 拓扑图展示服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图可以自动梳理组件之间的调用关系,帮助用户快速定位问题。 通过拓扑图查看组件查看间调用关系 登录AOM 2.0控制台。
您即将访问非华为云网站,请注意账号财产安全