检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。 配置完成后,单击“立即创建”,完成创建告警规则。
熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
存在单副本的Topic topicsWithSingleReplica 警告 存在单副本的Topic 请参考《MapReduce服务用户指南》的“ALM-38010 存在单副本的Topic”章节。
例如:CPU使用率,监控周期为5分钟,连续三个周期平均值≥80%,每一小时告警一次。 基础监控和操作系统指标请参见云产品监控指标。 说明: 每一小时告警一次是指告警发生后如果状态未恢复正常,每间隔一个小时重复发送一次告警通知。
图4 选择监控对象 重置监控对象筛选:单击监控视图详情右侧的第三个图标。 在监控视图详情窗口下方,您还可以通过以下方法选择监控对象:单击某一个资源对象关闭该监控项的走势图,再次单击该监控对象即可开启显示该指标走势。 父主题: 监控看板(旧版)
告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整
存在单副本的Topic topicsWithSingleReplica 警告 存在单副本的Topic 请参考《MapReduce服务用户指南》的“ALM-38010 存在单副本的Topic”章节。
POST请求体中时间戳(collect_time)的值必须从当前时间的前三天到当前时间后的十分钟之内某一时间,如果不在这个范围内,则不允许插入指标数据。
告警策略:平均值、监控周期5分钟、>=、80%、连续三个周期、每1天告警一次。 告警级别:重要。 发送通知:是。 通知方式:主题订阅。 通知对象:选择创建告警通知主题创建的主题。 生效时间:00:00-23:59 触发条件:依次勾选“出现告警”、“恢复正常”。
当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。
当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
操作 目前支持创建告警规则、关联告警模板、删除组三种操作。 父主题: 查看资源分组
详见下方【案例三】。 原因3:指标ID不属于云服务。详见下方【案例四】。 解决方法 支持监控的服务列表中命名空间、维度、监控指标参考文档三列内容匹配。 案例一 云服务对应的命名空间写错 指标ID mem_usedPercent 对应的命名空间为AGT.ECS。
熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent会主动触发熔断,熔断后,不会采集主机指标。后续Agent会尝试重新拉起。 父主题: 主机监控
按需调频,按量计费: 频率最快可达秒级探测;根据业务敏感度灵活调配探测机制和频率。 广域网故障链路可视: 广域网逐跳路径展示,快速诊断异常断点。 如何使用广域网质量监控 初次体验广域网质量监控?别担心,仅需简单几步。
操作步骤 创建广域网质量监控任务 通过广域网质量监控功能创建http(s)监控任务,监控中国境内三大运营商(中国移动、中国电信、中国联通)各省份用户访问监控目标域名时的连通性是否正常。
角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为云各服务之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。
建议将RDS的CPU使用率告警阈值设置为80%,连续三次超过阈值后开始告警。磁盘使用率、IOPS、使用中的数据库连接数等其他监控指标可根据您的实际情况来设置。 建议将弹性公网IP和带宽的出网带宽使用率告警阈值设置为80%,连续三次超过阈值后开始告警。
图3 资源实例 云服务概览: 云服务概览是对该类云服务资源使用情况的总览,包括资源概览、告警统计、关键指标三个部分。 资源概况统计资源的总数及正在告警的资源个数,以及7天告警的资源数。 告警统计是对当前所选云产品正在发生的告警数量进行的统计和汇总。