检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
大量的商品类目、用户信息、交易数量、店铺展示信息,会导致不同用户访问网站速度变慢。可使用站点监控对网站的可用性进行监控,并且对类目、用户、交易、店铺等接口进行持续拨测,测试接口的可用性,判断业务系统是否正常。 本章节以www.example.com为例,创建站点监控,并为站点的可用性、响应时间、丢包率创建告警规则,当发生异常时通知用户及时处理。
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
概览 主机监控分为基础监控、操作系统监控和进程监控。 基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用
站点监控 针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
Agent插件状态显示“运行中”但没有数据该如何处理? Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
Monitoring)作为网络性能监控中的关键功能,通过遍布全国的网络探测节点,模拟用户的实际请求来检测目标服务、DNS或IP地址等对象。这种主动式的网络测试能够监控目标对象在不同地理位置和运营商网络环境下的可用性、性能以及用户体验。利用这一功能,不仅可以加快故障识别与定位的速度,还能够帮助企业
更新自定义告警模板 功能介绍 更新自定义告警模板。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /V1.0/{project_id}/alarm-template/{template_id}
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
当某个进程占用多个CPU时,由于采集结果为多个CPU的总使用率,因此会出现CPU使用率超过100%的现象。 TOP5进程不固定,进程列表中展示的是近24小时内按一分钟统计周期进入过TOP5的进程。 只有近24小时内进入过TOP5的进程并开启了监控开关的进程才会采集CPU使用率、内存使用率和打开文件数。如
关系型数据库事件 关系型数据库是一种基于云计算平台的即开即用、稳定可靠、弹性伸缩、便捷管理的在线关系型数据库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 表1 RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败
什么是聚合? 聚合是指云监控服务在一定周期内对原始采样指标数据进行最大、最小、平均、求和或方差值的计算,并把结果汇总的过程。这个计算周期又叫聚合周期。 聚合是一个平滑的计算过程,聚合周期越长、平滑处理越多,用户对趋势的预测越准确;聚合周期越短,聚合后的数据对告警越准确。 云监控服
查询告警规则列表(V1) 功能介绍 查询告警规则列表,可以指定分页条件限制结果数量,可以指定排序规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用查询告警规则列表(推荐)与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
通过资源分组实现云资源分组监控 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则
CS-02),两台用于测试项目组(ECS-03和ECS-04)。现在需要通过告警通知功能,及时获取开发组下的两台弹性云服务器的资源运行状态(包含CPU利用率、CPU空闲时间占比、平均负载、I/O使用率、磁盘使用率、内存使用率、inode已使用占比),而测试组下的两台弹性云服务器不需要获取其运行状态。