检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当ECS、BMS出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。 父主题: 云监控在众包平台中的应用
配置完成后,单击“创建”,完成创建告警规则。 当网站的可用性、响应时间等出现异常时,站点监控会第一时间通过消息通知服务实时告知资源异常,提醒您处理异常。 父主题: 云监控在众包平台中的应用
什么是云监控服务? 云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。 图1 云监控服务架构图 云监控服务主要具有以下功能: 自动监控:
云服务监控 电商平台RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。
监控看板简介 监控看板为您提供自定义查看监控数据的功能,将您关注的核心服务监控指标集中呈现在一张监控看板里,为您定制一个立体化的监控平台。同时监控看板还支持在一个监控项内对不同服务、不同维度的数据进行对比查看,帮助您实现不同云服务间性能数据对比查看的需求。 旧版监控看板适用于以下
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
如何将告警通知发送给子账号? 如您想要将告警通知发给子账号,可以通过创建主题并添加订阅(在订阅信息中配置您的手机号码或邮箱),然后在创建告警规则时选择告警通知对象为您创建的主题 。 父主题: 告警
cphServerGpuOffline 重要 云手机服务器GPU显卡松动掉线 云手机服务器进行一次关机、开机操作 显卡掉线涉及的云手机出现运行故障,重启重置手机无法恢复 显卡TimeOut cphServerGpuTimeOut 重要 云手机服务器GPU显卡TimeOut 重启云手机服务器 显卡Timeo
cphServerGpuOffline 重要 云手机服务器GPU显卡松动掉线 云手机服务器进行一次关机、开机操作 显卡掉线涉及的云手机出现运行故障,重启重置手机无法恢复 显卡TimeOut cphServerGpuTimeOut 重要 云手机服务器GPU显卡TimeOut 重启云手机服务器 显卡Timeo
弹性伸缩的监控指标说明 云手机服务器 SYS.CPH Key:instance_id Value:云手机服务器ID Key:cph_id Value:云手机ID Key:disk_name Value:磁盘名称 Key:gpu_index Value:GPU名称 云手机服务器的监控指标说明
弹性伸缩的监控指标说明 云手机服务器 SYS.CPH Key:instance_id Value:云手机服务器ID Key:cph_id Value:云手机ID Key:disk_name Value:磁盘名称 Key:gpu_index Value:GPU名称 云手机服务器的监控指标说明
操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时页面上显示了当前云平台上的弹性云服务器列表。 单击ECS主机所在栏右侧的“更多 > 创建告警规则”。 弹出创建告警规则的窗口。 输入告警规则名称和描述。 按照如下所示配置参数。
管理Agent 本章节指导如何在Linux平台、Windows平台查看、启动、停止、更新和卸载Agent。 前提条件 已成功安装Agent插件。 Linux平台 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。 执行如下命令,确认使用Agent的版本。
在隔日生效时段发送通知消息。 如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00发送通知消息。 接收渠道 接收告警通知的渠道。 当接收对象选择主题订阅时,不涉及此参数设置。 通知内容模板 可选择默认或自定义。 若选择自定义,可选择指标模板、事件模板、站点监
告警屏蔽简介 告警屏蔽指云监控根据屏蔽规则对告警触发后的通知消息进行屏蔽,屏蔽生效后仅产生告警记录将不会接收到告警通知。 告警屏蔽主要针对云资源中触发的无效告警、或用户已知问题或故障导致的重复告警,以及用户识别的一些频繁但不重要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽
为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则、监控视图,极大的降低运维复杂度,提高运维效率。 前提条件
告警通知方式 通过企业微信接收告警通知 通过钉钉群接收告警通知 通过飞书群接收告警通知 申请开通SMN新协议公测
smart-log <nvme设备名>命令采集。 Huawei NVMe SSD附加SMART信息 Huawei NVMe盘的扩展SMART信息,包含更详细的一些指标和计数。(功耗、电容状态、坏块数量、更详细的错误计数) 使用hioadm info -d <nvme设备名> -a和 hioadm
快速入门 使用主机监控 使用站点监控 查看监控总览 04 实践 介绍在电商平台和视频直播等场景下如何使用云监控服务为您的资源稳定运行保驾护航。 最佳实践 电商平台业务监控 云监控在视频直播中的应用 云监控在众包平台中的应用 事件监控最佳实践 常见问题 了解更多常见问题、案例和解决方案
屏蔽告警规则与停用告警规则的区别: 停用告警规则后,将不再计算指标是否达到阈值,不再触发告警。 屏蔽告警规则生效后,仅产生告警记录将不会接收到告警通知。 父主题: 告警屏蔽