检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控,并在事件发生时进行告警。 事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一
根据需要可选择通知组或主题订阅两种方式。 通知组 需要发送告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 需要发送告警通知的对象,可选择云账号联系人或主题名称。 云账号联系人为注册时的手机和邮箱。 主题是消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题则需先创建主题并添加订阅,创建
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 资源分组支持企业项目,当选择了资源分组到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该资源分组。 父主题:
3-9226a9026070的弹性云服务器的监控数据cpu_util的平均值和维度是instance_id为06b4020f-461a-4a52-84da-53fa71c2f42b的弹性云服务器的监控数据network_vm_connections的平均值。 { "metrics":
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。
连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。 网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。
ELB监控 在视频直播中,网络访问流量的突增可能会引起业务的动荡,因此绝大多数的视频直播平台都会使用ELB自动分发流量到多台云服务器。 那么,ELB的稳定可靠运行对视频直播业务的正常运行至关重要。云监控可以监控ELB的异常主机数和并发连接数,确保您的业务稳定可靠运行。 操作步骤 登录管理控制台。
单击需要开启的云服务资源所在行右侧的一键告警开关,开启一键告警。 图1 开启一键告警 单击一键告警左侧的下拉按钮,可查看、修改或重置已开启的告警规则。 单击需要修改的告警规则所在行右侧的“修改”,可删除或添加告警策略,可根据需求设置发送通知。 单击资源类型所在行右侧的“重置”,可
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表5 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为in
本章节主要介绍如何在主机监控页面为弹性云服务器一键安装/升级Agent插件,为用户提供更加便捷的安装方式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点
当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。 若
问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了,并不是磁盘A的读写指标同时达到阈值时才告警。 云产品的与告警规则,当前是按实例层级计算告警的,只要该实例下所有配置的指标都触发了阈值,就会产生告警,如要配置具体资源的与告警,建议告警规则的资源层级选择子维度。
创建自定义告警/事件模板 您可以选择云服务监控提供的默认模板,也可以根据需要自定义添加告警指标完成自定义告警模板的添加。本章节介绍如何创建自定义告警/事件模板。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。
问题分析 弹性云服务器实例下有A、B两个磁盘,当磁盘A的读指标和磁盘B的写指标同时达到阈值时就告警了,并不是磁盘A的读写指标同时达到阈值时才告警。 云产品的与告警规则,当前是按实例层级计算告警的,只要该实例下所有配置的指标都触发了阈值,就会产生告警,如要配置具体资源的与告警,建议告警规则的资源层级选择子维度。
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
单击页面左侧的“事件监控”,在事件列表页面,单击相应事件右侧的创建告警规则。 此处以删除虚拟机事件为例,可根据业务需要,针对重启虚拟机、关闭虚拟机、删除网卡等创建告警规则。 当ECS、BMS出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。