检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
快速入门 概述 本节通过调用一系列云监控的API为ECS的cpu_util指标创建告警规则,当指标的数值达到设置的阈值时及时通知用户处理。 通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。
确认主账号已开启该区域插件权限,在云监控服务中单击“主机监控 - 弹性云服务器”,若页面上方未显示“一键配置”,则说明已开启该区域插件权限,否则需要单击“一键配置”来开启该区域插件权限。 鼠标移动至右上方的用户名,在下拉列表中选择“统一身份认证”。
单击“主机监控 > 弹性云服务器”,进入主机监控页面。 单击“安装&升级插件”,在右侧弹出安装&升级插件指引。 根据指引安装&升级插件。 图1 安装&升级插件 远程安装 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“主机监控 > 弹性云服务器”,进入主机监控页面。
操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。
查看所有已安装Agent的弹性云服务器列表。 Agent插件配置完成后,因监控数据暂未上报,插件状态仍显示“未安装”,等待3-5分钟,刷新即可。 父主题: 安装Agent(Linux)
me-east-1 https://uniagent-me-east-1.obs.me-east-1.myhuaweicloud.com/package/install_amd64.exe 操作步骤 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器
您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。
您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。
如何获取Agent的Debug日志? 操作步骤 找到并且修改Agent日志配置文件,<ces>、<ces_new>如果都存在则都要修改,<ces>、<ces_new>如果只存在一个,可以只修改一个。 Linux: /usr/local/uniagent/extension/install
Agent插件资源占用和熔断说明 资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源
单位:Byte/s 网络流出速率 每秒流出弹性云服务器的网络流量。 弹性云服务器对外提供访问或弹性云服务器作为FTP服务器供外部网络下载ECS上的资源时,都是网络流出。
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
Count 2.4.1 1分钟 GPU指标 指标分类 指标名称 指标说明 单位 支持版本 采集方式 GPU指标 gpu_status 虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。
主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。
安装配置Agent 修改DNS与添加安全组(Linux) 修改DNS与添加安全组(Windows) 手动配置Agent(Linux,可选) 手动配置Agent(Windows,可选) 父主题: 云监控插件(Agent)
Agent安装说明 安装Agent(Linux) 安装Agent(Windows) 父主题: 云监控插件(Agent)
表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启,并发送一个“ 因硬件故障触发重启”的事件,当迁移完成后,并发送一个“因硬件故障重启已完成”的事件,表示已恢复正常
入网带宽和出网带宽出现负值 老版本Agent在统计出入网带宽时,如若装有docker,当容器重启时无法统计虚拟网卡值,由于计算的是差值而导致出现负值的情况。 请参照管理Agent更新Agent。 父主题: 主机监控
升级Agent Linux Windows 父主题: 云监控插件(Agent)
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7.2