检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
告警级别有哪些? 告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下: 紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问
通过广域网质量功能监控不同地域不同网络环境用户访问某个域名时的连通性。当域名连通性为低于预期时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商(中国移动、中国电信、中国联通)探测某个域名为例,为您介绍如何通过广域网质量监控功能监控网络异常。
更新自定义告警模板 功能介绍 更新自定义告警模板。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI PUT /V1.0/{project_id}/alarm-template/{template_id}
告警通知系统模板更新记录 云监控服务930版本将短信告警通知系统模板中的告警信息进行了修改,具体变更信息如表1 短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接 新增
GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的时候,PATCH可能会去创建一个新的资源。
本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 在ECS详情页,单击安全组页签。 进入安全组列表页。 单击具体的安全组名。 单击“更改安全组规则”。 进入安全组详情页。 BMS的操作步骤: 请单击表格中左上角的安全组ID。 在对应安全组“操作”列单击“配置规则”。
ECC内存页隔离失败告警 eccPageRetirementRecordingFailure 重要 GPU硬件存在ECC故障,驱动自动隔离内存页时失败。 如果业务受损,请提交工单。 可能会造成业务中断,故障页隔离隔离失败,可能导致业务无法使用GPU。 GPU ECC页隔离告警 e
ECC内存页隔离失败告警 eccPageRetirementRecordingFailure 重要 GPU硬件存在ECC故障,驱动自动隔离内存页时失败。 如果业务受损,请提交工单。 可能会造成业务中断,故障页隔离隔离失败,可能导致业务无法使用GPU。 GPU ECC页隔离告警 e
更新资源分组 功能介绍 更新资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 在ECS详情页,单击安全组页签。 进入安全组列表页。 单击具体的安全组名。 单击“更改安全组规则”。 进入安全组详情页。 BMS的操作步骤: 请单击表格中左上角的安全组ID。 在对应安全组“操作”列单击“配置规则”。
批量更新监控视图 功能介绍 批量更新监控视图 接口约束 目前华东-青岛、拉美-墨西哥城一、土耳其-伊斯坦布尔、亚太-雅加达、中东-利雅得5个局点不支持该接口 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 在ECS详情页,单击安全组页签。 进入安全组列表页。 单击具体的安全组名。 单击“更改安全组规则”。 进入安全组详情页。 BMS的操作步骤: 请单击表格中左上角的安全组ID。 在对应安全组“操作”列单击“配置规则”。
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。
警资源数”和“7日告警资源数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。 关键指标 展示了产品自主推荐的关键指标的监控详情。 在云服务看板详情页面中,单击
存储库 √ × × × × 云连接 CC 云连接 √ × × × × 云数据迁移服务 CDM 实例 √ × × × × 内容分发网络 CDN 域名 √ √ × √ × 云防火墙 CFW 云防火墙实例 √ × × × × 表格存储服务 CloudTable 集群ID √ √ × √ ×
创建通知策略 表1 创建通知策略参数说明 参数 参数说明 语言 可选中文或英文。 名称 通知策略名称。 告警级别 根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。 通知类型 可选择触发或恢复,或者两者都选。 接收对象 需要发送告警通知的对象,可选择通知组或主题订阅两种方式。 当选
建议针对(Agent)CPU使用率、(Agent)内存使用率、(Agent)磁盘使用率可配置“平均值≥80%”、告警级别为重要的告警规则。同时配置“平均值≥90%”、告警级别为紧急的告警规则。 配置伸缩策略 单击“计算 > 弹性伸缩”。 在弹性伸缩组页面,单击“创建弹性伸缩组”,创建伸缩组请参见创建伸缩组。 创建完成
Agent被手动停止,启动插件方法参考管理Agent。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 Agent域名无法解析,修复方法参考修改DNS与添加安全组(Linux)、修改DNS与添加安全组(Windows)。 账号欠费。 Agent进程故障,先