检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
应用示例:用户自定义创建弹性云服务器CPU利用率告警 本章节用于指导用户在云监控服务为弹性云服务器创建告警规则,当弹性云服务器设置CPU使用率≥80%时触发告警。 创建步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时页面上显示了当前云平台上的弹性云服务器列表
创建告警规则和通知 本章节指导用户如何创建告警规则。 创建告警规则 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警规则”。 单击“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则的基本信息 图1 基本信息 表1
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机
创建站点监控的告警通知 操作场景 本章节指导用户对已创建的站点进行告警规则的配置。 前提条件 已创建站点监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“创建告警规则”。 在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示
事件监控支持的事件说明 表1 弹性云服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 ECS SYS.ECS 因系统故障触发重部署 startAutoRecovery 重要 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源,
使用事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等
告警屏蔽简介 告警屏蔽指云监控根据屏蔽规则对告警触发后的通知消息进行屏蔽,屏蔽生效后仅产生告警记录将不会接收到告警通知。 告警屏蔽主要针对云资源中触发的无效告警、或用户已知问题或故障导致的重复告警,以及用户识别的一些频繁但不重要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽进行处理
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现监控指标的增加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表
查看告警记录详情 当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面
自定义告警模板关联资源分组 自定义告警模板关联资源分组可实现批量创建不同资源的告警规则的功能。告警模板关联资源分组后将生成相应告警规则,告警规则中的策略会随模板同步修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。
创建屏蔽规则 操作场景 本章节用于指导如何创建屏蔽规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽
查看监控总览 监控概览为您提供了资源总览、告警统计、主机监控、网络监控、存储监控、站点监控概览等。通过查看监控概览,让您实时了解各云服务的资源使用情况和告警情况。 资源总览 资源总览展示您当前账户下弹性云服务器,关系型数据库、弹性公网IP和带宽、云硬盘、对象存储服务等云服务资源总数以及告警数
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了
一键告警 应用场景 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作