检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs |
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
云监控在视频直播中的应用 简介 主机监控 ELB监控 网络监控 父主题: 场景化实践案例
简介 在互联网飞速发展的时代,视频直播服务需求量不断加大。华为云稳定的ECS、VPC、ELB,可为您的视频直播服务提供稳定的资源,以保障便捷接入、低延迟、高并发、高清流畅的视频直播服务,减少视频卡顿、模糊带来的用户体验差的问题。 在华为云部署的视频直播业务典型架构图如图1所示,其
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
自定义监控展示用户所有自主定义上报的监控指标。用户可以针对自己关心的业务指标进行监控,将采集的监控数据通过使用简单的API请求上报至云监控服务进行处理和展示。 查看自定义监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“自定义监控”。 在“自定义监控”页
每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:
云监控在众包平台中的应用 简介 站点监控 主机监控 网络监控 事件监控 父主题: 场景化实践案例
主机监控 在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
带宽的监控数据没有超限记录但是收到了告警通知 出现此种情况,可能是您的事件监控的告警机制配置的“立即触发”,而带宽的监控数据聚合方式默认为5分钟内的平均值。因此您收到了事件告警的短信通知,但监控数据是正常的。 父主题: 告警
批量修改告警通知屏蔽规则的屏蔽时间 功能介绍 批量修改告警通知屏蔽规则的屏蔽时间 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_
如何查看数据盘的磁盘使用率和创建告警通知? 磁盘使用率指标需要您安装主机监控Agent。安装Agent后,如果需要创建磁盘使用率的告警通知,请在创建主机监控的告警规则时,告警策略选择“(Agent)磁盘使用率(推荐)”,并选择磁盘挂载点。 安装Agent后,您可以在管理控制台查看
查看监控指标:在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短
查询告警模板关联的告警规则列表 功能介绍 查询告警模板关联的告警规则列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/a
云审计服务支持的Cloud Eye操作列表 表1 云审计服务支持的Cloud Eye操作列表 操作名称 资源类型 事件名称 创建告警规则 alarm_rule createAlarmRule 删除告警规则 alarm_rule deleteAlarmRule 停用告警规则 alarm_rule
创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。 实例全量备份失败 单次全量备份失败产生的事件,不影响以前成功备份的文件,但会对“时间点恢复”的功能有一些影响,导致“时间点恢复”时增量备份的回复时间延长。 重新发起一次手工备份。
strings 需要批量启停的告警规则的ID列表 数组长度:1 - 100 alarm_enabled 是 Boolean 告警开关 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 alarm_ids Array of strings 成功启停的告警规则ID列表 数组长度:1
strings 需要批量启停的告警规则策略的ID列表 数组长度:1 - 100 enabled 是 Boolean 开关 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 alarm_policy_ids Array of strings 成功启停的告警规则策略ID列表