检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
DC,CSS,EVS,CBR,APIG)以及ICAgent采集的CCE和ECS指标。 步骤一:被监控账号接入云服务资源 下面的操作以接入接入FunctionGraph、ECS为例说明。接入CCE与接入ECS类似,但当前CCE购买时默认自动安装ICAgent。接入其他云服务资源的操
limit_bytes 容器可以使用的总内存量限制 machine_cpu_cores 物理机或虚拟机中的CPU核心数量 machine_memory_bytes 当前物理机或虚拟机的内存总数 serviceMonitor/monitoring/kube-state-metrics/0
容器组名称查看当前容器相关的节点、工作负载、容器组信息。 按告警管理维度查看当前集群的运行状态。 在左侧导航栏选择“告警管理 > 告警列表”,可查看该集群的告警详情,详情请参见查看告警。 在左侧导航栏选择“告警管理 > 事件列表”,查看该集群的事件详情,详情请参见查看事件。 在左侧导航栏选择“告警管理
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
查看告警 查看告警 在左侧导航栏中选择“告警 > 告警列表”。 在“告警列表”页面中查看告警。 设置时间范围,查看已设时间范围内产生的告警。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。
GPU使用率。 0~1.0 占比(Fraction) DCGM_FI_PROF_PIPE_TENSOR_ACTIVE Tensor Activity 表示Tensor(HMMA/IMMA) Pipe处于Active状态的周期分数。 该值表示一个时间间隔内的平均值,而不是瞬时值。 较高的值表示Tensor
设置为安装机,该VPC其它主机均可通过界面远程安装。 代理区/代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区由多个代理机组成,主要是考虑代理机的高可用性。
alarmActions 否 Array - 告警动作 alarmAdvice 否 String - 告警建议,请传入空字符串。 alarmDescription 否 String - 阈值规则描述 insufficientDataActions 否 Array - 数据不足动作 okActions
创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见:管理Prometheus实例。 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见:将Prometheus的数据上报到AOM。 父主题: Prometheus监控
监控相关API,包括查询指标,查询、添加监控数据等接口。 Prometheus监控 prometheus监控相关API,包括区间数据查询、瞬时数据查询等接口。 日志 日志相关API,包括查询日志接口。 Prometheus实例 Prometheus实例相关API,包括新增、查询Promet
clusterId 集群ID。 diskDevice 磁盘名称。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。 父主题: 指标总览
企业项目(Enterprise Project) 查询时间序列 POST /v2/{project_id}/series aom:metric:list √ × 查询时序数据 POST /v2/{project_id}/samples aom:metric:list √ × 查询指标 POST /v1/{
华为云成本中心支持通过多种不同的方式对成本进行归集和重新分配,您可以根据需要选择合适的分配工具。 通过关联账号进行成本分配 企业主客户可以使用关联账号对子客户的成本进行归集,从而对子账号进行财务管理。详细介绍请参见通过关联账号维度查看成本分配。 通过企业项目进行成本分配 在进行成本分配之前,建议开通企
&updateTimeEvent2alarmRuleBody, CreateTime: int64(1669276304343), Description: &descriptionEvent2alarmRuleBody, Name: "scl_test_event", UserId: "xxxxxxx"
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 注意事项 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
一键迁移 引导用户快速将仪表盘和告警规则数据从AOM 1.0一键迁移至AOM 2.0。 约束与限制 告警规则一键迁移提供全量规则迁移和迁移结果查询的能力。 后台判断用户是否进行过迁移(迁移状态:未迁移,迁移中,迁移完成) 如果进行过迁移,显示迁移完成的弹框。 如果没有进行过迁移,显示一键迁移的弹框。
等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。 指标命名空间
&updateTimeEvent2alarmRuleBody, CreateTime: int64(1669276173427), Description: &descriptionEvent2alarmRuleBody, Name: "scl_test_event", UserId: "xxxx"
"containerName", "nameSpace", "namespace", "netDevice", "nodeIP", "nodeName", "node_ip", "pailId", "pailName", "period_expr", "podID", "podName"