弹性云服务器 ECS-异构类实例安装支持对应监控的CES Agent(Linux):操作场景
操作场景
监控与告警是保证异构云服务器(GPU加速型实例、AI加速型实例)高可靠性、高可用性和高性能的重要功能。
通过在异构类(例如,GPU加速型实例、AI加速型实例)的Linux实例上安装支持对应监控的 CES Agent,可以为用户提供系统级、主动式、细颗粒度的监控,包含相关异构指标收集和系统事件上报。
当前支持的异构加速卡及对应的监控指标种类如下:
- GPU监控指标,请参见操作系统监控指标:GPU。
- NPU监控指标,请参见操作系统监控指标:NPU。
本章节介绍如何通过安装脚本为异构(GPU加速型、AI加速型)实例安装支持对应监控的CES Agent:
- 操作步骤(单台E CS 安装)
- 操作步骤(多台ECS批量安装)