检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
String 创建告警规则时选择的资源分组名称,如:Resource-Group-ECS-01 表4 dimensions字段数据结构说明 名称 参数类型 说明 name String 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。
主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ instance_type 否 String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS invocation_id 否 String 任务id 正则匹配:^([0-9A-Za-z]){1}([0-9A-Za-z]|_|-)*$
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30
资源总数 最小值:0 最大值:100 表5 Resource 参数 参数类型 描述 namespace String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
输入json模板文件,单击“load”。 图5 加载json模板 模板文件获取地址: 云搜索服务 CSS 云专线 DCAAS 分布式缓存服务 DCS 弹性云服务器 ECS 弹性负载均衡 ELB 关系型数据库 RDS Web应用防火墙 WAF Web应用防火墙 WAF-独享引擎实例 弹性公网IP和带宽
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30
time Long 是 事件发生时间。UNIX时间戳,单位毫秒。 说明:因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-1小时+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 detail Detail object
屏蔽截止时间,HH:mm:ss。 表4 Resource 参数 是否必选 参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent 安装Agent(Windows) ECS 安装Agent(Windows)
屏蔽截止时间,HH:mm:ss。 表4 Resource 参数 是否必选 参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
specified." } 术语解释 术语 解释 Cloud Eye 云监控 内置指标 各个服务有自己内置支持的指标和维度,比如弹性云服务器(SYS.ECS)支持的指标有cpu_util等。 Metric Metric由3部分组成:Namespace,Dimensions(optional)
查看云服务监控指标原始数据 本节介绍如何在OBS中通过下载监控数据文件查看已保存至OBS桶的原始数据。 约束与限制 仅支持旧版云服务监控操作。 前提条件 已在云监控服务中成功配置数据存储。配置数据存储请参见配置数据存储。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
添加订阅 主题是消息通知服务发送广播的通道。因此完成主题的创建之后,需要为这个主题添加相关的订阅者,这样,在监控指标触发告警条件时才能够将告警信息通过主题发送给订阅这个主题的订阅者。 操作步骤 登录管理控制台。 在页面左上角单击图标,选择“管理与监管” > “消息通知服务”。 进入消息通知服务页面。
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。
一键告警和告警对比一览表 告警类型 主要目标 范围 告警对象 告警触发方式 一键告警 当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分
次数为连续2次,比较关系为= 、阈值为80% 、告警频率为每5分钟告警一次。 表示:每5分钟收集一次 CPU 利用率的平均值数据,若某台云服务器的 CPU 利用率连续2次大于80%则每5分钟触发告警一次。 图1 告警策略 配置事件类告警策略 用户可以针对业务中的各类重要事件或对云
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。