检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸
主机监控 Agent状态切换或监控面板有断点该如何处理? 业务端口被Agent占用该如何处理? Agent一键修复失败问题排查 Agent一键修复后无监控数据问题排查 上报的指标被丢弃问题排查 Agent插件状态显示“故障”该如何处理? Agent插件状态显示“已停止”该如何处理?
告警简介 告警功能提供对监控指标的告警功能,用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 云监控服务使用消息通知服务
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则。
云服务监控及告警全流程介绍 用户购买了华为云资源后,并且该资源已经对接了CES云监控,那么该云服务的监控指标会自动上报给CES,用户可在CES进行资源监控指标数据的查看及配置告警,快速对云上资源进行全面、精准监控。 应用场景 资源购买后需要对资源的运行状态进行全面监控。 前提条件
通过钉钉群接收告警通知 您在通知对象中选择“钉钉”通知渠道,并填写钉钉机器人的Webhook地址后,如果资源的监控指标达到告警条件,即可通过钉钉群接收告警通知。 前提条件 请确保您已创建通知对象并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测。 创建钉钉机器人
修订记录 发布日期 修改说明 2024-01-24 第七十次正式发布: 事件监控支持的事件说明新增“数据库代理”事件描述。 Agent版本特性更新Agent版本。 新增创建/删除/复制/修改通知内容模板章节。 2024-01-18 第六十九次正式发布: 新增跨账号查看我的看板章节。
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的
Agent一键修复后无监控数据问题排查(老版本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败
通过企业微信接收告警通知 您在通知对象中选择“企业微信”通知渠道,并填写企业微信机器人的Webhook地址后,如果资源的监控指标达到告警条件,即可通过企业微信群接收告警通知。 前提条件 请确保您已创建通知对象,并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测。
获取项目ID 操作场景 在调用接口的时候,部分URL中需要填入项目ID,所以需要获取到项目ID。有如下两种获取方式: 调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目列表API获取。 获取项目ID的接口为“GET ht
配置云服务器全部挂载点磁盘使用率告警规则 场景描述 云监控服务提供了配置云服务器全部挂载点告警规则的能力。本章节介绍了配置云服务器全部挂载点磁盘使用率告警规则的操作流程。 磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。 如果选择了配置
通过飞书群接收告警通知 您在通知对象中选择“飞书”通知渠道,并填写Webhook地址、秘钥或自定义关键词后,如果资源的监控指标达到告警条件,即可通过飞书群接收告警通知。 前提条件 请确保您已创建通知对象,并开启“企业微信”通知渠道白名单,开启白名单请参考申请开通SMN新协议公测。
上报事件 功能介绍 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
通过HTTP(S)探测监控网络异常 应用场景 通过广域网质量功能监控不同地域不同网络环境用户访问某个域名时的连通性。当域名连通性为低于预期时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商(中国移动、中国电信、中国联通)探测某个域名为
配置数据存储 操作场景 云监控服务各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保存。您开通对象存储服务(Object Storage Service,以下简称OBS)后,可将原始数据同步保存至OBS,以保存更长时间。 本章节介绍如何配置数据存储。 仅支持旧版操作。
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常
安装Agent(Windows) 操作场景 本章节主要介绍如何在主机中安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安
批量安装Agent 操作场景 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。