检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。
指南登录机器后使用安装命令进行插件安装即可。 图1 安装插件指引 官网文档也可参考安装Agent(Windows)。 Linux类型机器安装Agent Linux类型的机器目前安装Agent支持单台安装和批量安装。 目前部分机器支持在CES页面直接一键安装,或者在购买ECS的页面直接支持开启监控安装Agent。
Agent安装说明 安装Agent(Linux) 安装Agent(Windows) 父主题: 云监控插件(Agent)
升级Agent Linux Windows 父主题: 云监控插件(Agent)
ECS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent 安装Agent(Windows) ECS 安装Agent(Windows) 批量安装Agent(Linux) ECS 批量安装Agent 安装配置依赖: 安装Agen
修改待安装Agent的ECS或BMS的DNS并添加安全组,具体步骤请参见修改DNS与添加安全组(Linux)或修改DNS与添加安全组(Windows)。 安装Agent,具体安装步骤请参见安装Agent(Linux)或安装配置Agent(Windows)。 5分钟后,当插件状态为“运行中”,说明Agent已安装成功。
使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。 使用ethtool -i <网口名>命令采集。 光模块信息 包括光模块的基本设备信息(SN、厂商、生产日期、连
Windows系统下,路径为:“C:\Program Files\uniagent\extension\install\telescope\bin” Linux系统下, 路径为:/usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf
风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。 若实例使用自建的私有镜像作为操作系统,请确保其包含了如
件被误删,请重新安装Agent。 服务器内部时间和本地标准时间不一致。 Agent插件版本不同,日志路径也不同。 日志路径分别如下: Linux: 新版本Agent:/usr/local/uniagent/extension/install/telescope/log/ces.log
新增BMS硬件监控插件说明章节。 下线安装GPU ECC监控插件(Linux)章节。 2023-08-21 第六十三次正式发布: 更新Agent版本特性章节。 优化Agent安装说明章节。 下线一键配置插件说明章节。 下线安装GPU指标与RAID指标采集插件采集插件(Linux)章节。 云产品监控指标中新增“消息通知服务的监控指标”。
返回“old agent”,表示使用老版本Agent。 返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查Agent进程是否存在: ps -ef |grep telescope
"detail": { "content": "{\"resourceSpecCode\":\"kc1.4xlarge.2.linux\",\"enterpriseProjectId\":\"6efb843e-391a-46a8-afc8-7fe51c9dd575\"}"
在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start.bat脚本,启动Agent。 Linux系统下: 执行以下命令查看telescope的PID。 ps -ef |grep telescope 强制关闭进程后等待3-5分钟tel
GPU内存页发生故障,故障可能由应用、驱动或硬件引起 如果业务受损,请提交工单。 可能GPU硬件问题导致显存故障,导致业务异常退出。 GPU驱动掉卡告警 gpuDriverLinkFailureAlarm 重要 GPU链路正常,NVIDIA驱动找不到GPU硬件 建议尝试重启虚拟机恢复业务。
GPU内存页发生故障,故障可能由应用、驱动或硬件引起 如果业务受损,请提交工单。 可能GPU硬件问题导致显存故障,导致业务异常退出。 GPU驱动掉卡告警 gpuDriverLinkFailureAlarm 重要 GPU链路正常,NVIDIA驱动找不到GPU硬件 建议尝试重启虚拟机恢复业务。
在“子网”页签中查看弹性云服务器的DNS服务器地址是否正确。 各区域DNS服务器地址配置以及如何修改DNS,请参考:Windows和Linux。 图1 DNS服务器地址 检查IAM委托配额。 登录管理控制台。 单击“服务列表 > 统一身份认证服务” 在左侧导航树选择“委托”。 查看委托配额。
以支持内存使用率(Linux)等指标,详见支持监控的服务列表。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 发布区域:以控制台实际上线区域为准 Agent支持的系统都有哪些? 安装Agent(Linux) 安装Agent(Windows)
弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在: ps -ef |grep telescope
管理Agent 管理Agent(Linux) 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/in