检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
时会在具体接口中专门说明。 是 application/json Content-Length 请求body长度,单位为Byte。 否 3495 X-Project-Id project id,项目编号。请参考获取项目ID章节获取项目编号。 否 如果是专属云场景采用AK/SK认证
project_id 是 String 租户ID 最小长度:1 最大长度:64 template_id 是 String 告警模板ID 最小长度:2 最大长度:64 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 租户Token
_id} 参数说明 表1 参数说明 名称 类型 是否必选 说明 project_id String 是 项目ID。 获取方式请参见获取项目ID。 group_id String 是 资源分组ID。 请求样例: PUT https://{云监控的endpoint}/V1.0/{pr
告警状态有哪些? 目前云监控服务支持六种告警状态: 告警中、已解决、数据不足、已触发、已失效、已解决(手动)。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
需要检查EIP带宽是否一直增加,业务是否正常,需要考虑进行扩容。 EIP封堵 带宽超过5G就会封堵,相当于把流量直接丢弃,说明带宽严重超限或收到攻击,一般是受到了DDoS攻击。 收到EIP解封事件时,说明封堵已被解封。 需要更换EIP,避免业务受到影响,同时查看事件中的封堵原因,进行相应处理。 EIP解封
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如
查询监控数据(ShowMetricData) 查询指定时间范围指定指标的指定粒度的监控数据。 添加监控数据(CreateMetricData) 添加一条或多条指标监控数据。 批量查询监控数据(BatchListMetricData) 批量查询指定时间范围内指定指标的指定粒度的监控数据,目前最多支持10指标的批量查询。
ts/{widget_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户id 最小长度:1 最大长度:64 widget_id 是 String 监控视图id 正则匹配:^wg([a-z]|[A-Z]|[0-9]){22}$ 请求参数
{template_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户ID 最小长度:1 最大长度:64 template_id 是 String 告警模板的ID,以at开头,后跟字母、数字,长度最长为64 最小长度:2 最大长度:64
服务资费 云监控服务基础功能免费,包括查看监控看板、创建告警规则、添加监控项等。同时云监控服务与其他云服务组合使用,为您提供监控数据文件转储、发送告警通知等增值服务,这些增值服务可能产生额外费用,具体由提供该功能的服务结算。 通常情况下,云监控服务产生的增值服务费用很低,因此建议您根据需要搭配使用。
企业项目 企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理。 启动日志记录 是否配置启动日志记录。 日志组 选择日志组。 日志组是云日志服务进行日志管理的基本单位,可以创建日志流以及设置日志存储时间。创建日志组请参见日志组。
s/batch-create 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户ID 最小长度:1 最大长度:64 alarm_id 是 String Alarm实例ID 正则匹配:al([a-z]|[A-Z]|[0-9]){22}$ 请求参数
s/batch-delete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户ID 最小长度:1 最大长度:64 alarm_id 是 String Alarm实例ID 正则匹配:al([a-z]|[A-Z]|[0-9]){22}$ 请求参数
GET /v2/{project_id}/alarm-templates 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户ID 最小长度:1 最大长度:64 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
Agent迭代版本已知版本特性如下: 2.7.5.1版本 分类 说明 发布时间 2024-12-20 新特性 基于2.7.5版本: GPU指标采集加固。 修复问题 无 2.7.5版本 分类 说明 发布时间 2024-12-20 新特性 优化网卡指标采集逻辑,完善网卡名称维度值规则规则校验
触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值, 因此无法触发告警。 父主题: 告警
数说明请参见配置参数。 建议针对可用性≤95%、响应时间≥400ms、丢包率≥5%等监控指标,配置告警级别为重要的告警规则。 配置完成后,单击“创建”,完成创建告警规则。 当网站的可用性、响应时间等出现异常时,站点监控会第一时间通过消息通知服务实时告知资源异常,提醒您处理异常。 父主题:
e √ × 批量查询指定时间范围内指定指标的指定粒度的监控数据,目前最多支持10指标的批量查询。 POST /V1.0/{project_id}/batch-query-metric-data ces:metricData:list √ × 查询指定时间范围指定事件类型的主机配置