检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
告警记录 告警记录展示所有告警规则的状态变化,默认展示近7天的告警记录,通过选择时间可以展示近30天的告警记录,用户可以统一、方便地回溯和查看告警记录。 查看告警记录详情 手动恢复告警记录 父主题: 告警
status 否 String 按状态信息进行过滤,取值只能为health(已设置告警规则且无告警触发的资源)、unhealthy(已设置告警规则且有告警触发的资源)、no_alarm_rule(未设置告警规则的资源) 枚举值: health unhealthy no_alarm_rule
云监控服务哪些资源支持企业项目? 目前,支持按企业项目分权分域的有:我的看板、资源分组、告警规则、可用性监控、云服务监控、站点监控和广域网质量监控。 父主题: 云服务监控
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现监控指标的增加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
修改告警规则 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警规则”,进入告警规则界面。 你可以选择以下两个路径进入告警规则修改页面: 在“告警规则”界面,单击待修改告警规则所在行“操作”列的“修改”按钮; 在“告警规则”界面,选择待修改告警规
bel,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。 表1 拓展标签支持情况 云服务 命名空间 是否支持拓展标签 标签数据来源 弹性云服务器 SYS.ECS/AGT.ECS √ 配置审计或弹性云服务器
主机监控安装Agent步骤优化。 2018-07-30 第二十五次正式发布。 本次变更如下: 事件监控新增ECS自动恢复事件。 资源分组支持裸金属服务器类型资源。 Agent支持安装到指定目录。 Agent支持设置指定端口号。 云硬盘新增监控指标。 2018-06-30 第二十四次正式发布。 本次变更如下:
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
资源总数 最小值:0 最大值:100 表5 Resource 参数 参数类型 描述 namespace String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
告警规则 展示该资源分组下的全部告警规则。并且可以在单个资源分组中对指定的告警规则进行创建、复制、启用、停用、删除、屏蔽等操作。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。