检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
入网带宽和出网带宽出现负值 老版本Agent在统计出入网带宽时,如若装有docker,当容器重启时无法统计虚拟网卡值,由于计算的是差值而导致出现负值的情况。 请参照管理Agent更新Agent。 父主题: 主机监控
Agent目前仅支持物理磁盘指标的采集,不支持通过网络文件系统协议挂载的磁盘。 CES Agent会默认屏蔽docker相关的挂载点。挂载点前缀如下: /var/lib/docker;/mnt/paas/kubernetes;/var/lib/mesos 指标 指标名称 指标说明 单位
BMS硬件监控指标采集说明 以下是BMS硬件监控插件对应的监控指标采集说明。 指标分类 指标说明 采集方式 服务器整机信息 服务器整机SN、产品名称、厂家等。 使用dmidecode命令采集。 SSD/HDD 基本信息和SMART信息 包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART
BMS硬件监控插件说明 Agent2.5.6.1版本后集成了物理机硬件监控插件,通过实时巡检发现硬件的亚健康状态,提前规避故障风险,为BMS实例提供全面硬件故障监控能力。 物理机硬件监控插件只针对BMS实例生效,其他云服务器不受其影响。 BMS实例缺失硬件监控插件会导致华为云无法
选择渠道 通知对象的渠道,每种渠道只能设置一个对象。 选择“电话”或“短信”终端,请输入有效手机号码。 输入规则为[+] [国家码][手机号码]。国内手机号码可省略[+]或[+] [国家码]。 例如: +8600000000000 +8600000000001 选择“邮箱”终端,请输入有效的邮箱地址。
云服务 英文简称 产品 手动添加 企业项目 标签 实例名称 组合匹配 弹性云服务器 ECS 云服务器 √ √ √ √ √ 裸金属服务器 BMS 云服务器 √ √ √ √ √ API网关专享版 APIC APIG实例 √ √ √ √ √ API网关 APIG 接口 √ × × × ×
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 Token认证 Token的
Value:Redis实例 Key:dcs_cluster_redis_node Value:数据节点 Key:dcs_cluster_proxy_node Value:Redis3.0 Proxy集群实例Proxy节点 Key:dcs_cluster_proxy2_node Value:Redis4
Value:Redis实例 Key:dcs_cluster_redis_node Value:数据节点 Key:dcs_cluster_proxy_node Value:Redis3.0 Proxy集群实例Proxy节点 Key:dcs_cluster_proxy2_node Value:Redis4
创建主机监控的告警通知 操作场景 本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击ECS或BMS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。
基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。
onsole页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则
或引入其他不稳定因素,请谨慎使用。 操作系统 版本 支持Agent安装(ECS) 支持Agent一键安装(ECS) 支持Agent安装(BMS) Windows Windows 2012 √ × √ Windows 2016 √ × √ Windows 2019 √ × √ Windows
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。
修改DNS与添加安全组(Linux) 操作场景 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您
统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可