检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
例如CPU使用率监控周期为5分钟,连续三个周期平均值≥80%,则触发告警。 当资源类型选择事件监控时,触发告警具体的事件为一个瞬间的事件。例如运行状态异常,则触发告警。 说明: 告警规则内最多可添加50条告警策略,若其中一条告警策略达到条件都会触发告警。 - 告警级别 根据告警
选择“云服务监控”。 分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务S
gent占用CPU或内存过高时,提供了熔断机制。当Agent负载过高时,会自动触发熔断,触发熔断机制后,Agent暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700
流入:表示以弹性云服务器为主体,每秒流入到弹性云服务器的流量。 流出:表示以弹性云服务器为主体,每秒流出到外部网络或客户端的流量。 流入流出方向如下图所示: 指标含义 表1 网络流入流出速率含义 带宽类别 描述 网络流入速率 每秒流入弹性云服务器的网络流量。 在弹性云服务器中下载外部网络资源或从
0天的告警记录,用户可以统一、方便地回溯和查看告警记录。当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。
未设置告警规则:组内所有资源均未设置告警规则。 事件告警状态 无告警:组内资源未触发事件。 已触发:组内有资源触发事件。 未设置告警规则:组内所有资源均未设置告警规则。 资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器
批量添加订阅终端时,每个终端地址占一行。 添加终端详情请参考消息通知服务用户指南的“添加订阅”。 单击“确定”。 新增订阅将显示在页面下方的订阅列表中。 在添加订阅后,对应的订阅终端会收到订阅通知,用户要选择确认订阅,后续才能收到告警信息。 父主题: 创建告警通知主题
告警功能提供对监控指标的告警功能,用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 云监控服务使用消息通知服务向用户通知告警信息。首先,
“告警通知”功能触发产生的告警消息由消息通知服务SMN发送,可能产生少量费用,具体费用请参考产品价格说明。 根据界面提示,配置归属企业项目。 图3 高级配置 表1 配置归属企业项目 参数 参数说明 归属企业项目 告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理
功能介绍 查询指定时间范围指定指标的指定粒度的监控数据,可以通过参数指定需要查询的数据维度。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{p
00表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小时告警一次,43200表示每12小时告警一次,86400表示每1天告警一次。 表5 meta_data字段数据结构说明
率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent会主动触发熔断,熔断后,不会采集主机指标。后续Agent会尝试重新拉起。 父主题: 主机监控
告警功能提供对监控指标的告警功能,用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 云监控服务使用消息通知服务向用户通知告警信息。首先,
、3600、10800、21600、43200、86400。0表示只告警一次,300表示每5分钟告警一次,600表示每10分钟告警一次,900表示每15分钟告警一次,1800表示每30分钟告警一次,3600表示每1小时告警一次,10800表示每3小时告警一次,21600表示每6小
修改告警规则告警通知信息 功能介绍 修改告警规则告警通知信息,告警策略&资源请使用对应接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /v2/{proj
入网带宽:统计测量对象入云平台的网络速度。 出网带宽:统计测量对象出云平台的网络速度。 查看网络监控数据需申请VPC并绑定EIP或带宽,请参见创建虚拟私有云和子网。 存储监控 存储监控展示磁盘最近5分钟读写带宽之和与最近5分钟读写IOPS之和,方便您了解磁盘使用情况。 查看存储监控数据需要购买云硬盘,请参见购买云硬盘。
监控服务管理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。
请求示例 创建告警模板名称为my_template,告警连续触发次数2次,每5分钟告警一次,告警级别重要的自定义模板。 { "template_name" : "my_template", "template_description" : "hello world", "policies"
异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。 因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。
gent占用CPU或内存过高时,提供了熔断机制。当Agent负载过高时,会自动触发熔断,触发熔断机制后,Agent暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700