检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
√ √ √ √ √ 安装Agent √(需同时拥有ECS FullAccess权限) × √ × √(需同时拥有ECS FullAccess权限) × 修复插件配置 √(需同时拥有Security Administrator、ECS FullAccess权限) × √ × √(需同时拥有Security
部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,API-Server为连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。
查看云服务监控指标原始数据 操作场景 本节介绍如何在OBS中通过下载监控数据文件查看已保存至OBS桶的原始数据。 仅支持旧版云服务监控操作。 前提条件 已在云监控服务中成功配置数据存储。配置数据存储请参见配置数据存储。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
略修改后,会自动同步,其他维度策略修改后不会自动同步。 例如:“资源层级”选择“子维度”,子维度为弹性云服务器,修改模板中弹性云服务器策略,会自动同步到告警规则中,修改弹性云服务器-磁盘策略,则不会自动同步。 模板 当告警类型选择指标且触发规则选择关联模板时,或告警类型选择事件且
名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 value String 维度取值,例如弹性云服务器的ID。 长度最短为1,最大为256。 表6 meta_data字段数据结构说明
time 是 Long 事件发生时间。UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 例如,当前时间为2020.01.30
告警简介 告警功能提供对监控指标的告警功能,用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 云监控服务使用消息通知服务
第三十六次正式发布: 新增图引擎服务监控指标说明。 2019-06-12 第三十五次正式发布: 使用前必读内容优化。 API概览内容优化。 如何调用API内容优化。 快速入门内容优化。 分布式缓存服务新增监控指标。 云文件服务新增监控指标。 弹性文件服务新增监控指标。 自然语言处理新增监控指标。
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可能导致管理控制台查不到操作系统监控数据。 修改裸金属服务器和用户客户端浏览
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
取值范围:只能由中文、英文字母、数字、下划线、中划线组成。长度范围:1-128个字符。 取值样例:dataShareJob-ECSMetric 资源类型 云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。
单次最多可添加100个资源。 屏蔽方式选择资源屏蔽时,可直接设置选择对象。 屏蔽方式选择策略屏蔽时,需要先设置选择规则和选择策略后,再设置选择对象。可选择全部资源或指定资源。 屏蔽方式选择事件屏蔽,且监控范围选择指定资源时,需要设置选择对象。 选择指标 仅当屏蔽方式选择资源屏蔽时,可选择需要屏蔽告警的指标。
监控数据文件转储:需要使用对象存储服务(OBS),转储后的监控数据文件将永久保存。 发送告警通知:需要使用消息通知服务(SMN),当云服务的状态变化触发告警规则设置的阈值时,发送邮件、短信、HTTP、HTTPS告知用户。 增值服务的计费方式如下: 对象存储服务(OBS) 对象存储服务提供按需付费、包年
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
当任务类型选择TCP或UDP时,可设置请求内容。 - 可用条件 当任务类型选择HTTP时,可用条件可设置为响应时间(ms)、状态码、Body。 当任务类型选择TCP或UDP时,可用条件可设置为响应时间(ms)、响应内容(十六进制)、响应内容(文本)。 当任务类型选择PING时,可用条件可设置为响应时间(ms)、丢包率(%)。
告警 告警简介 告警规则 告警记录 告警模板 告警通知 应用示例:用户自定义创建弹性云服务器CPU利用率告警 一键告警 告警屏蔽
status 否 String 按状态信息进行过滤,取值只能为health(已设置告警规则且无告警触发的资源)、unhealthy(已设置告警规则且有告警触发的资源)、no_alarm_rule(未设置告警规则的资源) 枚举值: health unhealthy no_alarm_rule