检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理
修改、删除、启用、停用数据转储 当业务变化或者之前配置的数据转储配置不符合您的业务需求时,您可参考本章节修改、停用、启用或删除数据转储任务。 修改数据转储任务 登录管理控制台。 单击“服务列表 > 云监控服务”。 在左侧导航树中选择“数据转储”。 单击数据转储任务所在行“操作”列的
创建资源分组 针对使用多种云产品的用户,通过资源分组功能将同一业务相关的弹性云服务器、裸金属服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源分组中。从分组角度查管理资源,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 约束与限制 一个用户最多可创建1000个资源分组
添加数据转储到当前账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。本章节指导如何将数据转储到当前账号。 一个账户最多创建20个数据转储任务
添加数据转储到其他账号 数据转储可以实时将云服务监控数据转储到分布式消息服务Kafka中。当您需要通过分布式消息服务Kafka的控制台或使用开源Kafka客户端查询云服务的监控指标时,可以使用云监控服务提供的数据转储功能。 在CES上配置转储监控数据时,选择的“转储目标”资源类型支持转储到其他租户账号购买的
数据转储任务资源异常问题排查 当“数据转储”页面,“转储目标位置”列显示“资源异常”时,有如下常见场景,请您排查: 资源已不存在:当转储的目标资源已不存在时,CES无法成功转储。需要登录“分布式消息服务DMS”控制台,在资源列表页查找确认该目标资源Kafka集群是否已被删除。若资源已被删除
应用场景 云监控服务为用户提供了非常丰富的使用场景。 云服务监控 用户开通了云监控服务支持的云服务后,即可方便地在云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent
在云监控服务看不到监控数据 当出现以下情况时,有可能在云监控服务中看不到监控数据: 购买云服务资源后,首先确认该服务是否已对接云监控服务,请参考支持监控的服务列表。 已对接云监控的服务,由于各个服务采集上报监控数据的频率各有不同,请耐心等待一段时间。 弹性云服务器或裸金属服务器关机超过
Excel打开监控数据CSV文件乱码如何处理? 用户使用云监控服务可以将监控数据导出为csv文件,而使用Excel工具打开该文件时,可能出现中文乱码的情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案
监控数据管理接口授权项说明 权限 对应API接口 授权项 IAM项目 企业项目 查询指定时间范围指定指标的指定粒度的监控数据,可以通过参数指定需要查询的数据维度。 GET /V1.0/{project_id}/metric-data?namespace={namespace}&metric_name
Agent一键修复后无监控数据问题排查 问题现象 Agent一键修复后运行正常,但仍然没有监控数据。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent
文档修订记录 发布日期 修改记录 2023-10-12 第四十六次正式发布: 本次变更如下: 新增告警通知。 新增一键告警。 新增告警通知屏蔽。 新增CES资源标签管理。 2023-08-31 第四十五次正式发布: 本次变更如下: 新增监控看板。 新增监控视图。 新增插件状态查询。
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
未安装UVP VMTools对弹性云服务器监控指标有什么影响? 未安装UVP VMTools,云监控服务无法提供监控弹性云服务器的内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个指标。但可以监控带外网络流入速率和带外网络流出速率指标,这样导致CPU使用率指标的精确性可能会降低
云服务监控 电商平台RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。