检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览
面配置资源分组时查看确认。 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS 云服务器 √ √ √ √ √ 裸金属服务器 BMS 云服务器 √ √ √ √ √ API网关专享版 APIC APIG实例 √ √ √ √ √ API网关 APIG
√ √ √ √ √ 安装Agent √(需同时拥有ECS FullAccess权限) × √ × √(需同时拥有ECS FullAccess权限) × 修复插件配置 √(需同时拥有Security Administrator、ECS FullAccess权限) × √ × √(需同时拥有Security
查看云服务监控指标原始数据 本节介绍如何在OBS中通过下载监控数据文件查看已保存至OBS桶的原始数据。 约束与限制 仅支持旧版云服务监控操作。 前提条件 已在云监控服务中成功配置数据存储。配置数据存储请参见配置数据存储。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 value String 维度取值,例如弹性云服务器的ID。 长度最短为1,最大为256。 表6 meta_data字段数据结构说明
time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 例如,当前时间为2020.01.30
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 dimensions Arrays of objects 是 一个或者多个资源维度。
to 是 String 查询数据截止时间UNIX时间戳,单位毫秒。from必须小于to。 dim 是 String 监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3
电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 使用资源分组和告警功能上报指定资源的监控指标 配置云服务器全部挂载点磁盘使用率告警规则
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
修订记录 发布日期 修改记录 2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
当任务类型选择TCP或UDP时,可设置请求内容。 - 可用条件 当任务类型选择HTTP时,可用条件可设置为响应时间(ms)、状态码、Body。 当任务类型选择TCP或UDP时,可用条件可设置为响应时间(ms)、响应内容(十六进制)、响应内容(文本)。 当任务类型选择PING时,可用条件可设置为响应时间(ms)、丢包率(%)。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART