检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云服务”和“Prometheus for 多账号聚合”的实例上报的基础指标和自定义指标数量。 指标上报量统计周期为1小时,如果设置的查询时间范围小于1小时,可能会导致指标累计上报量查询结果为0。 “资源消耗”页面展示的指标上报量可能与实际指标上报量存在一定误差。 操作步骤 登录AOM 2.0控制台。
通过仪表盘功能可视化监控CCE集群数据,通过告警规则功能,在集群发生故障时能够及时发现并预警。 配置仪表盘图表 登录AOM 2.0控制台。 在左侧菜单栏中选择“仪表盘”,单击“创建仪表盘”新建一个仪表盘,详情可参见创建仪表盘。 在仪表盘页面选择实例类型为“Prometheus for
total 写入花费的总时长 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node_nf_conntrack_entries_limit 链接状态跟踪表总量 node_processes_max_processes PID限制值 node_processes_pids
Occupancy 表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。
混合运算的表达式。 mix_promql 否 String 混合运算的promQL。 表13 CmdbInfo 参数 是否必选 参数类型 描述 app_id 否 String 应用id。 node_ids 否 Array of NodeInfo objects 节点信息列表。 表14
="***.***.***.***"}) by (nodeIP) 常用的普罗命令 常用的查询指标的普罗命令如表1所示,用户可根据实际修改其中的IP地址、ID等参数信息。 表1 常用的普罗命令 指标 标签定义 PromQL 主机CPU使用率 {nodeIP="",hostID=""}
介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称 指标含义 取值范围
nginx_ingress_controller_orphan_ingress 入口孤立状态,1 表示孤立。0 表示正常。“namespace”为标识入口命名空间的字符串,“ingress”表示入口名称,“type”表示孤立类型 为“no-service”'或 “no-endpoint”。 ngi