检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了
创建屏蔽规则 创建屏蔽规则可以对告警触发后的通知消息进行屏蔽,本章节用于指导如何创建屏蔽规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数
查看告警记录详情 告警记录展示所有告警规则的状态变化,默认展示近7天的告警记录,通过选择时间可以展示近30天的告警记录,用户可以统一、方便地回溯和查看告警记录。当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
一键告警 一键告警为您提供针对服务下所有资源快速开启告警的能力,旨在帮助用户快速建立监控告警体系,在资源异常时可以及时获得通知。本章节介绍如何使用一键告警功能一键开启关键监控项告警的服务。 一键式告警和普通告警的主要差异点如表1所示。 表1 一键告警和告警对比一览表 告警类型 主要目标
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作
自定义告警模板关联资源分组 自定义告警模板关联资源分组可实现批量创建不同资源的告警规则的功能。告警模板关联资源分组后将生成相应告警规则,告警规则中的策略会随模板同步修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。
创建广域网质量监控 通过使用广域网功能配置定时拨测任务,选择分布在全球的探测点对域名进行拨测,并根据协议拨测结果状态码识别服务的可用性。本章节指导用户如何创建广域网质量监控任务。 前提条件 已开通广域网质量监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择
服务优势 自动开通 云监控服务会自动开通。同时您可以很方便使用云监控服务管理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等
关系型数据库事件 关系型数据库是一种基于云计算平台的即开即用、稳定可靠、弹性伸缩、便捷管理的在线关系型数据库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 表1 RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期
弹性公网IP事件 虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽
创建广域网质量监控告警规则 本章节指导用户对已创建的广域网质量监控进行告警规则的配置。通过配置告警规则,可以在出现异常状态时立马告警,并收到服务故障信息。 前提条件 已创建广域网质量监控任务。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 >
通过HTTP(S)探测监控网络异常 应用场景 通过广域网质量功能监控不同地域不同网络环境用户访问某个域名时的连通性。当域名连通性为低于预期时,您可以通过报警信息分析异常原因,还可以根据探测结果排查问题。本文以中国境内各省份的三大运营商(中国移动、中国电信、中国联通)探测某个域名为例
创建/删除/复制/修改通知内容模板 通知内容模板是用户在配置告警通知时选择的一种通知内容格式。当通知方式选择通知组或主题订阅时,支持配置通知内容模板,通知内容模板可以选择系统模板、默认模板和自定义模板。 系统模板是是云监控服务系统自动提供的告警通知内容模版,用户无法进行修改 ,当用户未选择自定义告警通知内容模版时
告警策略 用户可以对服务的监控指标和事件设置告警策略。当监控指标在一定周期内多次触发告警策略的阈值时,系统将向用户发送告警通知。下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告警策略包括指标名称
添加数据转储到其他账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型支持转储到其他租户账号购买的
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu