检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
net_tcp_sys_recv (Agent) TCP SYS_RECV状态的连接数量。 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:
如何获取Agent的Debug日志? 操作步骤 找到并且修改Agent日志配置文件,<ces>、<ces_new>如果都存在则都要修改,<ces>、<ces_new>如果只存在一个,可以只修改一个。 Linux: /usr/local/uniagent/extension/ins
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs |
云监控在视频直播中的应用 简介 主机监控 ELB监控 网络监控 父主题: 场景化实践案例
云监控在众包平台中的应用 简介 站点监控 主机监控 网络监控 事件监控 父主题: 场景化实践案例
简介 在互联网飞速发展的时代,视频直播服务需求量不断加大。华为云稳定的ECS、VPC、ELB,可为您的视频直播服务提供稳定的资源,以保障便捷接入、低延迟、高并发、高清流畅的视频直播服务,减少视频卡顿、模糊带来的用户体验差的问题。 在华为云部署的视频直播业务典型架构图如图1所示,其
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
主机监控 在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸
查看监控指标:在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短
批量修改告警通知屏蔽规则的屏蔽时间 功能介绍 批量修改告警通知屏蔽规则的屏蔽时间 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
图1 配置站点监控的告警内容 表2 站点监控的告警内容配置 参数 参数说明 告警类型 告警规则适用的告警类型。 维度 用于指定告警规则对应站点的维度名称。 探测协议 目前可探测四种协议进行监控:HTTP(S)、PING、TCP、UDP。 监控范围 告警规则适用的资源范围,可选择资源分组或指定资源。
如何查看数据盘的磁盘使用率和创建告警通知? 磁盘使用率指标需要您安装主机监控Agent。安装Agent后,如果需要创建磁盘使用率的告警通知,请在创建主机监控的告警规则时,告警策略选择“(Agent)磁盘使用率(推荐)”,并选择磁盘挂载点。 安装Agent后,您可以在管理控制台查看
创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。 实例全量备份失败 单次全量备份失败产生的事件,不影响以前成功备份的文件,但会对“时间点恢复”的功能有一些影响,导致“时间点恢复”时增量备份的回复时间延长。 重新发起一次手工备份。