查询主机监控维度指标信息 功能介绍 根据ECS/BMS资源ID查询磁盘、挂载点、进程、显卡、RAID控制器维度指标信息;维度NPU已经为原始值,不需要调用该接口进行额外查询获取指标信息 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer
磁盘、网卡等指标,并为您带来性能及体验提升。 版本号一般为三位,例如2.7.5。 增强版 除提供基础版能力外,还将提供:GPU监控能力、NPU监控能力、BMS硬件故障监控能力。 版本号一般为四位,例如2.7.5.1。 注意: 增强版由于采集指标更多,可能会占用更多的主机资源,请合理选择插件版本。
CES Agent迭代版本已知版本特性如下: 2.7.6.1版本 分类 说明 发布时间 2025-04-15 新特性 基于2.7.6版本: NPU指标采集加固。 修复问题 无 2.7.6版本 分类 说明 发布时间 2025-04-15 新特性 优化windows下进程指标资源占用。 修复问题
Key:mount_point Value:挂载点 Key:proc Value:进程 Key:gpu Value:GPU Key:npu Value:NPU Key:davp Value:DAVP 弹性云服务器操作系统监控的监控指标(安装Agent) 裸金属服务器 SERVICE.BMS
保业务稳定运行,提升企业效率和用户体验。 在数字化浪潮席卷之下,网络与服务的稳定性已成为社会秩序平稳运行的基石。任何网络或服务的突发故障,深度影响社会的整体运作、企业的持续运营以及民众日常生活的品质,其所造成的损失往往难以计量。如2022年12月阿里云香港可用区C的服务中断,故障
分布式训练时共享内存不足导致训练失败 NPU:RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link 状态Down 请检查NPU Roce网口状态 NPU网卡不可用 NPU:RoCE网卡健康状态异常 RoCEHealthStatusError 重要 NPU 卡 %d
分布式训练时共享内存不足导致训练失败 NPU:RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link 状态Down 请检查NPU Roce网口状态 NPU网卡不可用 NPU:RoCE网卡健康状态异常 RoCEHealthStatusError 重要 NPU 卡 %d
单击页面左侧的“主机监控 > 弹性云服务器”,进入“主机监控”页面。 单击“主机监控”页面右上角“使用指南”,在弹出的“使用指南”页面单击“学习手动安装插件”。 在“安装插件指引”页面获取Agent的安装命令。 以华北-北京四安装地址为例,安装命令中斜体部分“uniagent-cn-north-4
您即将访问非华为云网站,请注意账号财产安全