检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择下拉出的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 监控对象为当前的ECS,无需配置。 选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。 以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设
连通性是否正常。 查看广域网质量监控 在监控任务详情页面,可通过“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”、自定义时间段、“运营商”、“探测点城市”查看该监控任务的可用率、平均响应时间,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”、“
Not Implemented 请求未完成。服务器不支持所请求的功能。 502 Bad Gateway 请求未完成。服务器从上游服务器收到一个无效的响应。 503 Service Unavailable 请求未完成。系统暂时异常。 504 Gateway Timeout 网关超时。
性云服务器的CPU使用情况。 单击不同CPU利用率的弹性云服务器,可跳转到基础监控图表页面。 查看主机监控数据需购买弹性云服务器,请参见自定义购买弹性云服务器。 网络监控 网络监控展示当前弹性公网IP和带宽的出网带宽与入网带宽最近1小时的网络速率,方便您了解网络使用情况。 入网带宽:统计测量对象入云平台的网络速度。
选择完查询条件后,单击“查询”。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题: 操作记录审计
AgentAccess权限的临时AK/SK,不会使用客户全局AK/SK,即当前的临时AK/SK只具备操作云监控服务的权限。 方便:您仅需在一个区域配置一次即可,无需对每个CES Agent手动配置。 父主题: 主机监控
如果不指定指标,则对所有指标生效。 选择规则 仅当屏蔽方式为策略屏蔽时,可选择资源的告警规则。 选择策略 仅当屏蔽方式为策略屏蔽时,可选择一个或多个告警策略进行屏蔽。 屏蔽时间 屏蔽规则的生效时间。 指定时间:设置屏蔽规则在指定时间范围内生效。 周期时间:设置屏蔽规则每天循环在固
场景一:服务可用性监控 从全国不同城市的运营商节点定期检查网站是否可访问,以便于提前预警可能影响业务连续性的风险。同时支持用户对探测结果是否“可用”的自定义断言规则,包含响应延时,状态码,响应 body 的内容匹配等。 场景二:网络可用性分析 通过使用广域网质量监控功能配置定时PING探测任务
Administrator权限的临时AK/SK,不会使用客户全局AK/SK,即当前的临时AK/SK只具备操作云监控服务的权限。 方便:您仅需在一个区域配置一次即可,无需对每个CES Agent手动配置。 如果授权后在IAM委托页面无法查询到“cesagency”,您可以手工在IAM管
下服务支持导出资源属性label,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。 表1 拓展标签支持情况 云服务 命名空间 是否支持拓展标签 标签数据来源 弹性云服务器 SYS.ECS/AGT
InstanceId可不用配置,保持"InstanceId":"",即可,若需要配置,需要遵循如下两条原则: 该资源ID需保证全局唯一性,即同一个RegionID下Agent使用的InstanceId不能相同,否则系统可能会出现异常。 InstanceId必须与实际的ECS或BMS资
仅当屏蔽方式选择策略屏蔽时,需要选择资源类型的告警规则。 选择策略 仅当屏蔽方式选择策略屏蔽时,需要选择资源类型的告警策略。 说明: 可以选择一个或多个告警策略进行屏蔽。 若该告警策略是所有策略都满足才告警时,则不支持选择策略。 选择对象 选择需要屏蔽告警的资源。 说明: 单次最多可添加100个资源。
Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Tok
InstanceId可不用配置,保持"InstanceId":"",即可,若需要配置,需要遵循如下两条原则: 该资源ID需保证全局唯一性,即同一个RegionID下Agent使用的InstanceId不能相同,否则系统可能会出现异常。 InstanceId必须与实际的ECS或BMS资
说明 round_trip_time 响应时间 响应时间指站点对用户的请求做出的反应时间,即探测点和站点建立连接完成到探测点收到响应消息第一个字节的时间。 单位:毫秒。 availability 可用性 该指标以小时为周期进行统计,开通1小时后即可查看指标。 可用性 =(每小时返回正常状态数
默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。如果CPU或内存任何一个超出,Agent直接退出:如果没有超过第二阈值,查看Agent是否超过第一阈值(占用CPU超过10%或占用内存超过200M),连续三次超过第一阈值,则退出Agent进程并记录。
Metric由3部分组成:Namespace,Dimensions(optional),MetricName,单纯的MetricName不是一个指标,不能标识任何东西。 错误码说明 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 模块 http状态码
在创建告警规则界面,云产品选择“弹性云服务器 > 云服务器”,选择监控范围,可以根据需要选择全部资源、资源分组、指定资源。 建议选择“云产品”层级配置告警,子维度配置一个资源维度仅可配置一条告警。 图11 配置告警规则 配置完成后可以在告警规则列表进行查看。 查看主机告警记录 当接收到告警通知后,可在告警记
1分钟 GPU指标 指标分类 指标名称 指标说明 单位 支持版本 采集方式 GPU指标 gpu_status 虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。 - 2.4.5 Linux: 通过调用GPU卡的libnvidia-ml.so.1库文件获取
3000:响应体中的所有datapoints(指标数据列表)总和。 原因1:若上报指标周期小于批量查询监控数据的监控周期,会将监控周期内上报的多条指标数据按照聚合规则聚合成一个点,所以导致查询出来的指标数据量少于上报的数据量。 原因2:若上报指标周期与批量查询监控数据的监控周期相同,根据上面计算规则,最多返回的指标数据量为3000。