检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云监控服务不需要开通,在创建弹性云服务器等资源后监控服务会自动启动,您可以直接到云监控服务查看该资源运行状态并设置告警规则。 主机监控: 通过在弹性云服务器或裸金属服务器中安装云监控服务Agent插件,用户可以实时采集ECS或BMS 1分钟级粒度的监控数据。已上线CPU、内存和磁
迁移过程中系统会自动重启云服务器。 等待虚拟机迁移成功,状态恢复正常。 实例重部署开始。 因系统故障重部署已完成 endAutoRecovery 重要 当自动迁移完成后,弹性云服务器已恢复正常。 确认业务是否恢复。 实例重部署结束。 实例重部署超时 faultAutoRecovery
据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。 执行如下命令,确认使用老版本Agent。
迁移过程中系统会自动重启云服务器。 等待虚拟机迁移成功,状态恢复正常。 实例重部署开始。 因系统故障重部署已完成 endAutoRecovery 重要 当自动迁移完成后,弹性云服务器已恢复正常。 确认业务是否恢复。 实例重部署结束。 实例重部署超时 faultAutoRecovery
Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图标题进行编辑,也可以增加监控指标、删除监控指标或修改当前已添加的监控指标。 图1 配置监控视图 目前单个“监控视图”最多支持添加50个监控指标。
界面。 参数按照表1所示配置参数。 配置完成后,单击“确定”,完成创建站点监控。 当提交内容为key=value格式时,HTTP请求头必须为Content-Type: application/x-www-form-urlencoded。 提交内容、HTTP请求头、请求Cookies按实际情况填写。
packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:2xx代表成功处理请求,3xx代表请求被重定向,4xx代表请求错误等。
主体订阅:通过在消息通知服务(SMN)配置的主题,快速将该消息推送至消息主题。 通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。 父主题: 告警配置方式
Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud
告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 表2 主机监控告警内容配置说明 参数 参数说明 取值样例 告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。
告警配置方式 配置指标告警
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
已对接云监控的服务,由于各个服务采集上报监控数据的频率各有不同,请耐心等待一段时间。 弹性云服务器或裸金属服务器关机超过1小时以上。 云硬盘没有挂载给弹性云服务器或裸金属服务器。 弹性负载均衡未绑定后端服务器或者后端服务器全部关机。 资源购买时间不足10分钟。 无数据上报的服务在云服务监控页面
主机监控页面创建Agent安装任务。 “监控数据导出”和“告警记录导出”中的导出任务会在创建时间7天后清除。 监控数据导出 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控 > 弹性云服务器”或“主机监控 > 裸金属服务器”,进入主机监控页面。 单击
告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使
为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资
手动配置Agent(Windows,可选) 用户成功安装Agent插件后,推荐您采用“修复插件配置”方式配置Agent。如果“修复插件配置”不成功或其他原因导致无法配置Agent,你可以采用本章节提供的手工方式配置Agent。 约束与限制 目前支持Linux操作系统和Window
发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent 站点监控 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。其提供简单的添加配置,不再浪费资源和精力配置复杂的开源产品。并且支持站点异常告警,不用担心网站出问题而无人知晓。
为什么配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到阈值却触发了告警? 问题现象 告警规则配置了磁盘读和磁盘写指标同时达到阈值时则告警,实际并没有同时达到告警阈值却触发了告警。 问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达
云容器引擎-成长地图 | 华为云 云监控 云监控(Cloud Eye)为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解华为云上的资源使用情况、业务的运行状况,并及时收到异常报警做出反应,保证业务顺畅运行。 图说云监控 产品介绍 立即使用 成长地图 由浅入深,带您玩转云监控