检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看主机监控的监控指标 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考安装配置Agent进行安装。 操作步骤
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。
使用资源分组和告警功能上报指定资源的监控指标 场景描述 云监控服务提供了资源分组功能和告警功能。如何将您的资源进行有效分组,并按分组后的资源监控指标通过短信或邮箱告知告警信息呢? 本章节为您解答上述问题。 假设我们有4台云服务器,两台用于开发项目组(ECS-01和ECS-02),
什么是云监控服务? 云监控服务为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。云监控服务架构图如图1所示。 图1 云监控服务架构图 云监控服务主要具有以下功能: 自动监控:
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
状态码 正常 返回值 说明 200 OK GET和PUT操作正常返回。 201 Created POST操作正常返回。 202 Accepted 请求已被接受。 204 No Content DELETE操作正常返回。 异常 返回值 说明 400 Bad Request 服务器未能处理请求。
资源概览 资源概览界面显示当前分组中包含的资源类型、每个类型下包含的资源总数、维度、资源告警状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 单击资源分组列表中的其中一个分组名,进入分组资源概览界面。
云监控服务支持哪些服务的企业项目维度的分权分域监控? 目前,云监控服务支持的企业项目维度的分权分域资源有:弹性云服务器、弹性伸缩、云硬盘、弹性IP、弹性负载均衡、云数据库、分布式缓存服务、文档数据库服务和分布式消息服务。 父主题: 云服务监控
云容器引擎-成长地图 | 华为云 云监控 云监控(Cloud Eye)为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解华为云上的资源使用情况、业务的运行状况,并及时收到异常报警做出反应,保证业务顺畅运行。 图说云监控 产品介绍 立即使用 成长地图 由浅入深,带您玩转云监控
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
告警通知是什么,分为几类? 告警通知是告警状态触发时所采取的行为,用户可以在创建、修改告警的时候设置通知,也可以关闭通知。 通知目前支持两种: 触发告警时给用户发送邮件或短信通知或通过HTTP、HTTPS形式发送消息至服务器。 触发弹性伸缩自动扩容和缩容。 父主题: 告警
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
查看监控总览 监控概览为您提供了资源总览、告警统计、主机监控、网络监控、存储监控、站点监控概览等。通过查看监控概览,让您实时了解各云服务的资源使用情况和告警情况。 资源总览 资源总览展示您当前账户下弹性云服务器,关系型数据库、弹性公网IP和带宽、云硬盘、对象存储服务等云服务资源总
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
查看主机监控的资源详情 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口。 可查看该监控的实例名称、实例ID、资源分组情况。
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
查询主机监控维度指标信息 功能介绍 根据ECS/BMS资源ID查询磁盘、挂载点、进程、显卡、RAID控制器维度指标信息;维度NPU已经为原始值,不需要调用该接口进行额外查询获取指标信息 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的