检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"float", "value": 0.01, "unit": "Ratio" } ] 请求样例三:添加分布式缓存服务的维度dcs_instance_id为1598b5d4-3cb5-4f4d-8d99-2425d8e9ed54和dcs_cluste
批量安装Agent 本章节主要介绍如何批量安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 批量安装不支持跨区域执行。 批量安装的主机需同属一个VPC。 Windows版本暂不支持批量安装Agent。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
使用率等指标,详见支持监控的服务列表。 操作系统监控:通过在弹性云服务器或裸金属服务器中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1次。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标,详见支持监控的服务列表。
安装Agent(Windows) 操作场景 本章节主要介绍如何在主机中安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安
json配置文件default-shm-size字段 方式二: docker run 命令中使用 --shm-size 参数来设置单个容器的共享内存大小 分布式训练时共享内存不足导致训练失败 NPU:RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link
json配置文件default-shm-size字段 方式二: docker run 命令中使用 --shm-size 参数来设置单个容器的共享内存大小 分布式训练时共享内存不足导致训练失败 NPU:RoCE网卡down RoCELinkStatusDown 重要 NPU 卡 %d RoCE Link