检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作
概述 欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表
站点监控 针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的
监控大盘简介 监控大盘是根据一些重点云服务的资源水位使用情况、核心业务指标的推荐,内置的默认监控看板。用户仅需简单的开启大盘即可创建完成重点服务的看板视图,方便可视化观测云上资源的各类核心重点指标数据。 监控大盘适用于对重点云服务资源有整体资源监控使用情况观测的场景。若您想要快速对整体资源进行视图创建
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等
创建资源分组 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 约束与限制 一个用户最多可创建1000个资源分组
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期
资源分组支持的云服务 由于智能创建资源分组的能力依赖云服务对接config资源管理服务,可能存在部分云服务在某些region未对接config的情况,具体支持情况可在页面配置资源分组时查看确认。 云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS
查看主机监控的监控指标 本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系统级别监控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考Agent安装说明进行安装。 操作步骤
查询告警规则列表(V1) 功能介绍 查询告警规则列表,可以指定分页条件限制结果数量,可以指定排序规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用查询告警规则列表(推荐)与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer
查询自定义告警模板列表 功能介绍 查询自定义告警模板列表。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/alarm-template
查询告警历史 功能介绍 根据告警ID查询告警历史。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/alarm-histories
查询单条告警规则信息 功能介绍 根据告警ID查询告警规则信息。 告警规则V1接口只支持配置单资源单策略规则,建议使用查询告警规则列表(推荐)、查询告警规则资源列表与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
Agent支持的指标列表 操作系统指标: CPU 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) cpu_usage (Agent)CPU使用率 该指标用于统计测量对象当前CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出cpu
修改告警规则 功能介绍 修改告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量增加告警规则资源、批量删除告警规则资源和修改告警规则策略(全量修改)与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成
为什么告警通知内容中不显示资源名称? CES云监控的告警通知中,存在部分云服务的告警中未显示实例名称,主要原因有三种: 云服务未按CES的规范对接,导致无法查询到资源名称信息。 云服务未对接RMS,CES无法从RMS获取到资源的名称信息。 其他情况:资源已被删除、部分资源本身无名称信息
查询事件监控列表 功能介绍 查询事件列表,包括系统事件和自定义事件。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id}/events
查看监控视图 监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板 > 自定义监控看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图
创建告警规则和通知 当您需要监控各云服务资源的使用情况或云服务资源的关键操作时,可以创建告警规则。告警规则添加完成后,当监控指标触发设定的阈值或者事件发生时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。 本章节指导用户如何创建告警规则。 创建告警规则
查询某一事件监控详情 功能介绍 根据事件监控名称,查询该事件发生的详细信息。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /V1.0/{project_id