检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent一键修复后无监控数据问题排查(老版本Agent) 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时
使用资源分组 应用场景 业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr
创建告警规则 应用场景 告警功能为您提供监控数据的告警服务。您可以通过创建告警规则来定义告警系统如何检查监控数据,并在监控数据满足告警策略时发送报警通知。 对重要监控指标创建告警规则后,便可在第一时间得知指标数据发生异常,迅速处理故障。 功能介绍 支持对云监控服务的所有监控项创建告警规则
基础监控与操作系统监控数据出现不一致的问题 现象 基础监控显示CPU使用率90%以上,接近100%,操作系统内监控的CPU使用率不到50%,两者相差较大。 原因 如果您在操作系统(Guest OS)中配置idle=poll,当操作系统内部空闲时,进入polling状态消耗计算资源,
使用事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等
告警屏蔽简介 告警屏蔽指云监控根据屏蔽规则对告警触发后的通知消息进行屏蔽,屏蔽生效后仅产生告警记录将不会接收到告警通知。 告警屏蔽主要针对云资源中触发的无效告警、或用户已知问题或故障导致的重复告警,以及用户识别的一些频繁但不重要的告警,为减少这类告警对运维的干扰,可以通过告警屏蔽进行处理
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现监控指标的增加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表
查看告警记录详情 当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警记录”,进入“告警记录”界面。 在告警记录页面,可查看近7天触发的告警的信息。 单击操作列的“查看监控详情”,右侧弹出监控详情页面
创建屏蔽规则 操作场景 本章节用于指导如何创建屏蔽规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 单击页面右上角的“创建告警屏蔽”。 在“创建屏蔽规则”界面,根据界面提示配置参数,参数如表1所示。 图1 创建告警屏蔽
查看监控总览 监控概览为您提供了资源总览、告警统计、主机监控、网络监控、存储监控、站点监控概览等。通过查看监控概览,让您实时了解各云服务的资源使用情况和告警情况。 资源总览 资源总览展示您当前账户下弹性云服务器,关系型数据库、弹性公网IP和带宽、云硬盘、对象存储服务等云服务资源总数以及告警数
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作
创建广域网质量监控 操作场景 本章节指导用户如何创建广域网质量监控任务。 前提条件 已开通广域网质量监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“网络性能监控 > 广域网质量监控”。 在“监控任务”页面,单击“创建任务”。 根据界面提示,配置广域网质量监控的基础信息
服务优势 自动开通 云监控服务会自动开通。同时您可以很方便使用云监控服务管理控制台或API接口查看云服务运行状态并设置告警规则。 实时可靠 原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看
配置自定义看板 自定义看板作为云服务看板的补充,允许您可以通过自定义的方式创建可视化看板,您可以自主选择指标、图表类型来展现您关注的资源图表。 前提条件 请确保您拥有云监控服务的操作权限,并且可以创建自定义看板。 操作步骤 单击系统左侧主菜单“我的看板”,进入看板列表页面,单击“创建看板
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等