检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口
指标数据保留多长时间? 指标数据分为原始指标数据和聚合指标数据。 原始指标数据是指原始采样指标数据,原始指标数据一般保留2天。 聚合指标数据是指将原始指标数据经过聚合处理后的指标数据,聚合指标数据保留时间根据聚合周期不同而不同,通过API获取的聚合指标数据保留时间如下: 表1 聚合指标数据保留时间
批量修改告警通知屏蔽规则的屏蔽时间 功能介绍 批量修改告警通知屏蔽规则的屏蔽时间 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
云监控服务相关概念 使用云监控服务之前,请先了解以下相关概念,从而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内
Arrays of objects 指标数据。数组长度最大500。 详细参数请参见表3。 from 是 Long 查询数据起始时间,UNIX时间戳,单位毫秒。建议from的值相对于当前时间向前偏移至少1个周期。由于聚合运算的过程是将一个聚合周期范围内的数据点聚合到周期起始边界上,如果
资源分组的ID,如:rg1603786526428bWbVmk4rP。 create_time Long 否 资源分组的创建时间,UNIX时间戳,单位毫秒。如:1603819753000。 relation_ids Array of Strings 否 企业项目ID列表。 type
nt负载过高时,会自动触发熔断,触发熔断机制后,Agent暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。如果CPU或内存任何一个超出,Agent直接退出:
网络监控 在众包平台活动期间,网站首页、登录页面、店铺详情页都会出现瞬时间的访问流量变大的情况,因此需随时监控出网带宽。 并且可能受到DDOS攻击或业务量大时连接数突增,导致业务访问变慢,预计SNAT连接数会达到平时访问量的2-3倍,所以需随时监控SNAT连接数。 操作步骤 登录管理控制台。
Agent各种状态说明及异常状态处理方法 基础监控与操作系统监控数据出现不一致的问题 云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 未安装UVP VMTools对弹性云服务器监控指标有什么影响? 为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标?
0:00发送通知消息。 alarm_id String 告警规则的ID。 update_time Long 告警状态变更的时间,UNIX时间戳,单位毫秒。 alarm_state String 告警状态,取值说明: ok,正常 alarm,告警 insufficient_data,数据不足
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
次、连续4次、连续5次、连续10次、连续15次、连续30次、连续60次、连续90次、连续120次、连续180次。 连续2次 比较关系 比较检测指标值和阈值的关系。 比较关系分为>、>=、<、<=、=、!=、环比上升、环比下降和环比波动。 说明: 环比上升:监控本次指标上报的数据与
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
Kafka支持的监控指标 分布式消息服务 RabbitMQ支持的监控指标 2020年04月 序号 功能名称 功能描述 阶段 相关文档 1 支持云专线网络质量指标 检测云专线端到端的网络质量,主要包含网络时延和丢包率两个指标。 商用 安装云专线指标采集插件 2020年03月 序号 功能名称 功能描述 阶段
查看监控视图 监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图。
创建事件监控的告警通知 操作场景 本章节指导用户针对事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”。 在事件列表页面,单击页面右上角的“创建告警规则”。 在“创建告警规则”界面,配置参数。 配置告警规则的基本信息。
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
查询告警记录列表 功能介绍 查询告警记录列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/alarm-histories