检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
示)。TXT格式只能导出日志的内容(如图2所示),每行为一条日志。 图1 以CSV格式导出日志 图2 以TXT格式导出日志 (可选)单击“配置转储”,将搜索到的日志一次性转储到OBS桶的同一个.log日志文件中。具体操作详见添加一次性转储。 父主题: 日志管理(旧版)
群信息、安装状态和采集状态。 图1 查看集群接入信息 根据需要,选择需要接入的集群,单击该集群右侧的“一键安装”,为集群安装云原生监控插件。 图2 接入CCE集群 等待安装成功,单击“关闭”即可接入该CCE集群,并将集群关联到当前Prometheus实例。 单击“取消安装”,可取消对应CCE集群的接入。
"hint" : "", "id" : "xxxxxxxxxx", "param_group" : "ecs_instance", "param_name" : "xxxxx", "param_type" : "HOST"
容器组件指标及其维度 表1 容器指标 指标名称 指标含义 取值范围 单位 CPU内核总量(aom_container_cpu_limit_core) 该指标用于统计测量对象限制的CPU核总量。 ≥1 核(Core) CPU内核占用(aom_container_cpu_used_core)
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
能,降低您使用SDK的难度,推荐使用。 SDK列表 表1提供了AOM服务支持的SDK列表,您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 表1 SDK列表 编程语言 Github地址 参考文档 Java huaweicloud-sdk-java-v3 Java
(推荐)POST方法获取标签名列表 功能介绍 该接口使用POST方法获取标签名列表。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
删除告警行动规则 功能介绍 删除告警行动规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
统计事件告警信息 功能介绍 该接口用于分段统计指定条件下的事件、告警。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/events/statistic 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标
删除事件类告警规则 功能介绍 删除一条事件类告警规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
删除静默规则 功能介绍 删除静默规则。 调用方法 请参见如何调用API。 URI DELETE /v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台获取,
GET方法获取标签名列表 功能介绍 该接口使用GET方法获取标签名列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/labels 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
元数据查询 功能介绍 该接口用于查询指标的元数据。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/metadata 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从
查询监控数据 功能介绍 该接口用于查询指定时间范围内指标的监控数据,可以通过参数指定需要查询的数据维度,数据周期等。(该接口已不再演进,建议使用 (推荐)POST方法查询区间数据接口。) 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metricdata
通过AOM监控集群 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
获取工作流执行中的执行详情 功能介绍 该接口可获取任务的执行详情,可指定工作流ID和执行ID去查询对应的任务,返回任务执行详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/cms/workflow/{workflow_id}/execut
查询标签值 功能介绍 该接口用于查询指定标签名的值 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/aom/api/v1/label/{label_name}/values 表1 路径参数 参数 是否必选 参数类型 描述 label_name 是