检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击主机名称,进入主机详情页面,在主机详情卡片区域,可查看该主机的运行状态、ID等信息。 单击任一页签,在列表中可监控运行在主机上实例的资源占用、健康状态信息和显卡、网卡等常用系统设备信息。 在ECS主机的“进程列表”页签下,可查看该主机的进程状态、IP地址等信息。 在进程列表右上角的搜索框可按进程名称等设置搜索条件,实现进程过滤显示。
UniAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet 代理机ip”,检查代理机和目标机器间的网络连通性。 安装ICAgent时需要开放8149、8102、8923、30200、30201和80端口,安装完成后80端口是否可以关闭? 答:80端口仅用
触发指标告警。 高级设置 检查频率 根据设置的频率对指标数据查询和分析结果进行检查。 XX小时:间隔XX小时检查一次查询和分析结果。 XX分钟:间隔XX分钟检查一次查询和分析结果。 XX秒:间隔XX秒检查一次查询和分析结果。 检查频率可以设置为15秒或30秒以实现秒级监控。指标告
U、物理内存、文件系统等信息。 在“相关资源”页签下,可按节点和节点名称、工作负载和负载名称、容器和容器名称查看当前容器组下的节点、工作负载、容器。 在左侧导航栏选择“洞察 > 容器 ”,可查看该集群的所有容器状态和资源使用情况。 在容器列表上方,可按容器名称设置过滤条件,实现容器过滤显示。
是为AOM服务提供中间件指标采集和自定义指标采集的能力。 UniAgent本身不提供数据采集能力,运维数据由不同的插件分工采集。 ICAgent:ICAgent插件主要是作为AOM和LTS的采集端,用于指标采集和日志采集。 图1 ICAgent和UniAgent概述图 父主题: 采集管理
erprise Project):自定义策略的授权范围,包括IAM项目与企业项目。授权范围如果同时支持IAM项目和企业项目,表示此授权项对应的自定义策略,可以在IAM和企业管理两个服务中给用户组授权并生效。如果仅支持IAM项目,不支持企业项目,表示仅能在IAM中给用户组授权并生效
息。 应用发现 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。 日志配置 提供日志配额和分词设置功能。 配额配置 当指标超过配额时,时间较早的指标将会被删除。 指标配额可通过切换基础版(受限免费)和按需版(按需计费)来修改。 指标配置 指标采集开关用来
监控 “√”表示支持,“x”表示暂不支持。 表1 监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据
日志 “√”表示支持,“x”表示暂不支持。 表1 日志 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 查询日志 POST /v1/{project_id}/als/action aom:log:list √ × 父主题:
告警 “√”表示支持,“x”表示暂不支持。 表1 告警 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增一条事件类告警规则 POST /v2/{project_id}/event2alarm-rule aom:ev
Prometheus实例 “√”表示支持,“x”表示暂不支持。 表1 Prometheus实例 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 卸载托管Prometheus实例 DELETE /v1/{project_id}/aom/prometheus
UniAgent管理 “√”表示支持,“x”表示暂不支持。 表1 UniAgent管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 下发批量安装UniAgent任务 POST /v1/{project_id}/un
Prometheus监控 “√”表示支持,“x”表示暂不支持。 表1 prometheus监控 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 区间数据查询 GET /v1/{project_id}/aom/api/v1/query_range
应用资源管理 “√”表示支持,“x”表示暂不支持。 表1 应用资源管理 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 新增应用 POST /v1/applications aom:cmdbApplication:create
自动化运维 “√”表示支持,“x”表示暂不支持。 表1 自动化运维 权限 对应API接口 授权项 IAM项目(Project) 企业项目(Enterprise Project) 创建任务 POST /v1/{project_id}/cms/workflow cms:workflow:create
gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0
应用洞察下的应用监控和进程监控下的应用监控有什么区别? AOM 2.0控制台中存在两个“应用监控”功能,入口不同,对应的功能也不同。 入口为:“应用洞察 > 应用监控” 主要监控用户通过应用资源管理功能统一管理的所有资源对象与应用,通过该应用监控可以及时了解应用的资源使用、状态和告警等信息,以便快速响应,保证系统顺畅运行。
如何区分Prometheus监控功能采集的基础指标和自定义指标数据? 用户可以登录AOM控制台,进入Prometheus实例的详情界面,通过查看Prometheus监控功能采集的指标数据类型,区分基础指标和自定义指标。 具体操作如下: 登录AOM 2.0控制台。 在左侧导航栏选择“Prometheus监控
组件监控 组件即您部署的服务,包括容器和普通进程。例如,云容器引擎(CCE)服务中的工作负载(workload)可以是一个组件,同时直接在虚机上运行的tomcat也可以是一个组件。 组件列表展示了每个组件的类型、CPU占用、内存占用和告警状态等信息,您可直观了解每个组件的运行状态
”特殊字符。 添加标签 标签是组件的标识,通过标签您可区分系统组件和非系统组件。AOM默认为系统组件(系统组件包括icagent、css-defender、nvidia-driver-installer、nvidia-gpu-device-plugin、kube-dns、org.tanukisoftware