检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了,并不
环比波动:监控本次指标上报的数据与上一次指标上报的数据相比出现陡升或陡降的变化情况。 = 阈值 设置告警触发的阈值和单位。 紧急22Byte/s 告警频率 当告警产生时,告警以特定的频率重复通知。 告警频率可设置以下几种方式: 只告警一次、每5分钟告警一次、每10分钟告警一次、每15分钟告警
针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。 静态阈值:指告警触发规则设置成固定的阈值,如果指标达到设置的阈值,则触发告警。 动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。 静态阈值 事件类型 当告警类型选
间段聚合后的值,当选择其他聚合区间时,导出的数据会分别按照周、天、小时聚合后导出。 监控项 云产品:默认为弹性云服务器/裸金属服务器,无需设置。 资源范围:可选择全部资源、资源分组、企业项目或指定资源。 监控指标:指定要导出的监控指标。 配置完成后,单击“确认”。 导出任务提交成
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。
alarm_level 否 Integer 设置告警级别,值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 表4 condition字段数据结构说明 名称 是否必选 参数类型 说明 comparison_operator 是 String 告警阈值的比较条件,可以是>、=、<、>=、<=。
cycle_wave为环比波动; 指标告警可以使用的阈值符号有>、>=、<、<=、=、!=、cycle_decrease、cycle_increase、cycle_wave; 事件告警可以使用的阈值符号为>、>=、<、<=、=、!=; value 否 Number 告警阈值。 unit 否 String
告警规则简介 云监控服务支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也支持使用告警模板为多个资源或者云服务批量创建告警规则。 在您使用告警模板创建告警规则之前,云监控服务已经根据各个云服务的应用属性以及云监控服务多年的开发、维护经验,为
建议设置负载均衡ELB网络流出速率的80%作为告警阈值。 建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%
网络监控 在众包平台活动期间,网站首页、登录页面、店铺详情页都会出现瞬时间的访问流量变大的情况,因此需随时监控出网带宽。 并且可能受到DDOS攻击或业务量大时连接数突增,导致业务访问变慢,预计SNAT连接数会达到平时访问量的2-3倍,所以需随时监控SNAT连接数。 操作步骤 登录管理控制台。
问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值, 因此无法触发告警。 父主题: 告警
针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。 静态阈值:指告警触发规则设置成固定的阈值,如果指标达到设置的阈值,则触发告警。 动态阈值:指告警触发阈值是根据智能计算指标的历史数据预测指标的阈值,若实际值偏离预测值,则触发告警。 静态阈值 触发规则 根据需要可选择关联模板、导入已有模板或自定义创建。
告警状态有哪些? 目前云监控服务支持五种告警状态: 告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
Prefix_CloudEye_region_2016-05-30T16-20-56Z_21d36ced8c8af71e.json OBS桶名和事件前缀为用户设置,其余参数均为系统自动生成。 监控数据原始文件是时间粒度的分片文件,文件中包含该时间分片下某一个资源下所有指标的监控数据,以Json格式存储。
当重要事件发生时,立即触发告警通知。 优势:配置简单,一键式打开开关。 弹性云服务器、弹性公网IP和关系型数据库的重要事件。 事件监控 指标监控 立即触发 普通告警 根据设置的告警策略触发告警。例如:CPU利用率在5分钟内的平均值连续5次>=80%时发送告警通知。 优势:告警策略更加灵活,可根据业务情况灵活配置。
1m # 设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。 配置完成后,单击“立即创建”,完成创建告警规则。 告警规则创建完成后,当业务量飙升,监控指标触发设定的阈值时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。如果CPU或内存任何一个超出,Agent直接退出:如果没有超过第二阈值,查看Agent是否超过第一阈值(占用CPU超过10%或占用内存超过200M),连续三次超过第一阈值,则退出Agent进程并记录。
带宽的监控数据没有超限记录但是收到了告警通知 为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 父主题: 故障排查
采样周期越大,短期内的数据失真越大。所以云监控服务更适合用于网站长期监测、长期监测运行在弹性云服务器内的应用趋势等。 同时,使用云监控服务用户可通过设置阈值对资源进行提前告警,保证资源稳定可靠。 父主题: 主机监控