检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是云监控服务? 云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。 图1 云监控服务架构图 云监控服务主要具有以下功能: 自动监控: 云监控服务不需要开通
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu
云服务监控简介 应用场景 云服务监控可收集云服务内置监控指标的数据,您可以通过监控这些指标来跟踪对应云服务状态。除了查看监控数据,您还可以在云服务监控页面创建告警规则和导出原始监控数据。 功能特性 查看监控指标:在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值
未安装UVP VMTools对弹性云服务器监控指标有什么影响? 未安装UVP VMTools,云监控服务无法提供监控弹性云服务器的内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个指标。但可以监控带外网络流入速率和带外网络流出速率指标,这样导致CPU使用率指标的精确性可能会降低
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
Hive默认数据仓库被删除,会导致在默认数据仓库中创建库、创建表失败,影响业务正常使用。
告警策略 用户可以对服务的监控指标和事件设置告警策略。当监控指标在一定周期内多次触发告警策略的阈值时,系统将向用户发送告警通知。下面将展示如何配置指标类和事件类的告警策略。 配置指标类告警策略 用户可以针对云服务的核心监控指标设置指标告警,在发生异常时及时通知您采取措施。指标类告警策略包括指标名称
手动配置Agent(Windows,可选) 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果“修复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Windows
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源,
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了
云服务监控及告警全流程介绍 用户购买了华为云资源后,并且该资源已经对接了CES云监控,那么该云服务的监控指标会自动上报给CES,用户可在CES进行资源监控指标数据的查看及配置告警,快速对云上资源进行全面、精准监控。 应用场景 资源购买后需要对资源的运行状态进行全面监控。 前提条件
告警状态有哪些? 目前云监控服务支持五种告警状态: 告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致
数据转储 数据转储简介 添加数据转储到当前账号 添加数据转储到其他账号 修改、删除、启用、停用数据转储
怎样让新购ECS实例中带有操作系统监控功能? 操作场景 本章节指导用户如何让新购买的ECS实例带有操作系统监控功能。 制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入ECS
数据转储简介 数据转储是指在使用云服务监控时将一些重要的监控指标数据信息通过使用转储能力将数据存储到分布式消息服务kafka中,以便数据能及时保存,进而对业务监控数据做更详细的分析或者其他数据消费使用。 父主题: 数据转储