检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保
业务端口被Agent占用该如何处理? 云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sy
添加监控视图 在完成监控看板的创建后,您就可以添加监控视图对云服务进行监控。目前每个监控看板最多支持50个监控视图。 在同一个监控视图里,您可以添加50个监控指标,支持跨服务、跨维度、跨指标进行对比监控。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“监控看板
创建主题 操作场景 主题作为发送消息和订阅通知的信道,为发布者和订阅者提供一个可以相互交流的通道。 在这一部分,您可创建一个属于自己的主题。 创建主题 登录管理控制台。 在管理控制台左上角选择区域和项目。 在服务列表选择“消息通知服务”。 进入消息通知服务页面。 在左侧导航栏,选择“主题管理”
将监控数据导出到自建Prometheus/Grafana Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloudeye服务接入prometheus后,您可以利用 prometheus更好地监控和分析来自
事件监控最佳实践 常见问题 了解更多常见问题、案例和解决方案 热门案例 什么是聚合? 指标数据保留多少时间? 什么是云监控服务? Agent支持的系统有哪些? 业务端口被Agent占用该如何处理? 云监控服务支持的聚合方法有哪些? 为什么监控数据中会出现跳点的情况? 如何导出监控数据?
说明 round_trip_time 响应时间 响应时间指站点对用户的请求做出的反应时间,即探测点和站点建立连接完成到探测点收到响应消息第一个字节的时间。 单位:毫秒。 availability 可用性 该指标以小时为周期进行统计,开通1小时后即可查看指标。 可用性 =(每小时返回正常状态数
配额管理 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
我的看板简介 我的看板为您提供自定义查看监控数据的功能,将您关注的核心服务监控指标集中呈现在一张看板里,为您定制一个立体化的监控平台。同时我的看板还支持在一个监控视图内对不同服务、不同维度的数据进行对比查看,帮助你实现不同云服务间性能数据对比查看的需求。 父主题: 监控看板(新版)
POST请求发送周期应小于最小聚合周期,否则会出现聚合数据点不连续。例如:聚合周期为5分钟,发送周期为7分钟,则5分钟情况的聚合数据会出现每10分钟才出现一个点。 POST请求体中时间戳(collect_time)的值必须从当前时间的前三天到当前时间后的十分钟之内某一时间,如果不在这个范围内,则不允许插入指标数据。
ClientPort Agent占用的起始端口号。 说明: 默认为0,表示随机占用。1-1023为系统保留端口,建议不要配置。 PortNum Agent占用的范围的个数。 说明: 默认为200,若ClientPort配置5000,则表示在5000-5199端口中随机占用。 Agent插件配
用户空间CPU使用率。 % 2.4.5 1分钟 cpu_usage_system (Agent)内核空间CPU使用率 该指标用于统计测量对象当前内核空间占用CPU使用率。 采集方式(Linux):通过计算采集周期内/proc/stat中的变化得出内核空间CPU使用率。用户可以通过top命令查看
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
监控看板简介 监控看板为您提供自定义查看监控数据的功能,将您关注的核心服务监控指标集中呈现在一张监控看板里,为您定制一个立体化的监控平台。同时监控看板还支持在一个监控项内对不同服务、不同维度的数据进行对比查看,帮助您实现不同云服务间性能数据对比查看的需求。 旧版监控看板适用于以下
ctions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。 被通知对象的ID列表的参数类型为字符串。 表5 ok_actions字段数据结构说明
ctions至少有一个不能为空。 若alarm_actions、insufficientdata_actions(该参数已废弃,建议无需配置)、ok_actions同时存在时,notificationList值保持一致。 被通知对象的ID列表的参数类型为字符串。 表6 ok_actions字段数据结构说明
ClientPort Agent占用的起始端口号。 说明: 默认为0,表示随机占用。1-1023为系统保留端口,建议不要配置。 PortNum Agent占用的范围的个数。 说明: 默认为200,若ClientPort配置5000,则表示在5000-5199端口中随机占用。 BmsFlag
主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU
Agent占用CPU或内存过高时,提供了熔断机制。当Agent负载过高时,会自动触发熔断,触发熔断机制后,Agent暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过70
聚合周期内指标数据的最大值。 最小值 聚合周期内指标数据的最小值。 求和值 聚合周期内指标数据的求和值。 方差 聚合周期内指标数据的方差。 聚合运算的过程是将一个聚合周期范围内的数据点根据相应的聚合算法聚合到周期起始边界上,以5分钟聚合周期为例:假设当前时间点为10:35,则10:30~10:35之