检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 必须以字母开头,只能包含0-9/a-z/A-Z/_/-,长度最短为1,最大为32。 value 是 String 维度取值,例如弹性云服务器的ID。 必须以字
=、环比上升、环比下降和环比波动。 说明: 环比上升:监控本次指标上报的数据与上一次指标上报的数据相比出现陡升的情况。 环比下降:监控本次指标上报的数据与上一次指标上报的数据相比出现陡降的情况。 环比波动:监控本次指标上报的数据与上一次指标上报的数据相比出现陡升或陡降的变化情况。 = 阈值 设置告警触发的阈值和单位。
警规则设置的阈值时,系统提供电话、短信、邮箱、企业微信、钉钉、飞书和Welink通知,还可以通过HTTP、HTTPS将告警信息发送至告警服务器,用户可以在第一时间知悉业务运行状况,便于构建智能化的程序处理告警。 批量创建告警规则 告警模板可以帮助用户为多个云服务快速创建告警规则,极大的提高了维护人员的工作效率。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称。 云服务器 监控范围 告警规则适用的资源范围,可选择全部资源、资源分组或指定资源。 说明: 选择“全部资源”时,则任何
原因2:指标对应的维度错误。详见下方【案例二】 原因3:ECS实例未安装agent插件。详见下方【案例三】 原因4:ECS实例安装的agent插件没有上报磁盘使用率指标数据。详见下方【案例四】 案例一 命名空间错误 命名空间错误。若查询的是弹性云服务器中操作系统监控指标,命名空间需为AGT.ECS。 请求参数: {
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 Agent域名无法解析,请先确认修改DNS与添加安全组中DN
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
资源总数 最小值:0 最大值:100 表5 Resource 参数 参数类型 描述 namespace String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sys/net/ipv4/ip_local_port_range,并重启Agent解决此问题。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。
组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:自定义策略中授权项定义的内容即为权限。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action
云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的
原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30 20:00:00到2019-04-30
告警历史的告警级别。值为1、2、3、4。其中1为紧急,2为重要,3为次要,4为提示。 namespace 否 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。 from 否 查询告警历史的起始时间。UNIX时间戳,单位毫秒,如:160
屏蔽截止时间,HH:mm:ss。 表4 Resource 参数 是否必选 参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因。 功能概览 资源分组可以跨产品,真正从业务角度管理您的云上资源。