检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、网卡类相关监控项、NTP类相关监控项、TCP连接数类相关监控、GPU相关监控项、NPU相关监控项。 安装Agent后,对于不同的操作系统、不同的弹性云服务器类型,您可以查看不同类型的操作系统监控指标。指标采集周期是1分钟。
在弹性云服务器“监控”列,单击“”,可查看当前弹性云服务器的监控数据。 在弹出的监控指标页面右上角,单击“查看更多指标详情”,查看弹性云服务器的完整监控数据,包含操作系统监控、基础监控以及进程监控。 图1 监控数据 在弹性云服务器监控区域,您可以通过选择时长,查看对应时间的监控数据。 当
器的各项性能指标。 主机监控分为基础监控、操作系统监控和进程监控。 基础监控:ECS自动上报的监控指标,可以监控CPU使用率等指标。 操作系统监控:通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。除了CPU使用率等指标外,还可以支持内存使用率(Linux)等指标。
监控安全风险 为使用户更好地掌握弹性云服务器的运行状态,您可以使用云监控服务的主机监控功能监控您的弹性云服务器,执行自动实时监控、告警和通知操作,帮助您更好地了解弹性云服务器的各项性能指标。 主机监控包括基础监控、操作系统监控和进程监控。 基础监控为用户提供免安装的基础指标监控服务。
弹性云服务器支持的基础监控指标 功能说明 本节定义了弹性云服务器上报云监控的基础监控指标的命名空间,监控指标列表,各项监控指标的具体含义与使用说明,用户可以通过云监控检索弹性云服务器服务产生的监控指标和告警信息。 命名空间 SYS.ECS 基础监控指标支持列表 对于不同的操作系统
Agent,可以为用户提供系统级、主动式、细颗粒度的监控,包含相关异构指标收集和系统事件上报。 当前支持的异构加速卡及对应的监控指标种类如下: GPU监控指标,请参见操作系统监控指标:GPU。 NPU监控指标,请参见操作系统监控指标:NPU。 本章节介绍如何通过安装脚本为异构(GPU加速型
弹性云服务器支持的进程监控指标(安装Agent) 功能说明 通过在弹性云服务器中安装Agent插件,可以对主机内的活跃进程进行监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 本节定义了弹性云服务器上报云监控的进程监控指标。 命名空间 AGT.ECS 进程监控指标说明 对
选择智能购买组类型。 一次性交付:智能购买组仅在启动时尝试一次性创建目标容量的实例,即使未达到目标容量也不再重试。 持续保持:智能购买组实时监控当前集群的容量与目标容量,如未达到目标容量继续创建实例,直至满足目标容量。如果超出目标容量则自动缩容至目标容量。 选择启动时间。 智能购买
Agent,可以为用户提供系统级、主动式、细颗粒度的监控,包含指标收集和系统事件上报。 当前支持的异构加速卡及对应的监控指标种类为GPU监控指标,请参见操作系统监控指标:GPU。 本章节介绍如何通过安装脚本为GPU加速型实例安装新版支持GPU监控的CES Agent。 约束与限制 仅支持Windows操
设置告警规则 操作场景 通过设置弹性云服务器告警规则,用户可自定义监控目标与通知策略,及时了解弹性云服务器运行状况,从而起到预警作用。 设置弹性云服务器的告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、监控周期和是否发送通知等参数。本节介绍了设置弹性云服务器告警规则的具体方法。
使用CES监控ECS 监控弹性云服务器 弹性云服务器支持的基础监控指标 弹性云服务器支持的操作系统监控指标(安装Agent) 弹性云服务器支持的进程监控指标(安装Agent) 异构类实例安装支持对应监控的CES Agent(Linux) 异构类实例安装支持对应监控的CES Agent(Windows)
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 监控安全风险 故障恢复 认证证书 擎天Enclave
查询事件 操作场景 本文介绍如何通过弹性云服务器的控制台查询系统上报的事件。 您还可以通过云监控服务的“事件监控”查看ECS实例的事件,详细内容请参见查看事件监控数据。 前提条件 如果您通过IAM用户进行本操作,则需要在操作前对IAM用户进行授权。 查询及响应事件操作依赖以下策略:
注册云服务器监控(废弃) 功能介绍 将云服务器添加到监控表中。 注册到监控表中的云服务会被ceilometer周期性采集监控数据,包括平台的版本、cpu信息、内存、网卡、磁盘、硬件平台等信息,这些数据上报给云监控。例如SAP云服务器内部的插件会周期性从云监控中查询监控数据,以报表形式呈现给SAP。
T4 GPU设备显示异常 问题描述 使用NVIDIA Tesla T4 GPU的云服务器,例如Pi2或G6规格,执行nvidia-smi命令查看GPU使用情况时,显示如下: No devices were found 原因分析 NVIDIA Tesla T4 GPU是NVIDIA的新版本,默认使用并开启GSP
基础监控 基础监控无需安装Agent,是ECS自动上报的监控指标。基础监控指标的监控周期为5分钟(KVM实例)。 操作系统监控 操作系统监控需要在弹性云服务器中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。操作系统监控的监控周期为1分钟(KVM实例)。 购买云服务器时的开启操作系统监控的方法:
ved Nginx高可用Web集群方案进行部署。 操作维护管理 监控管理 为了使用户能够及时获取弹性云服务器的各项性能指标及运行状态,建议您使用云监控服务,执行自动实时监控、告警和通知操作。 详细内容,请参见云监控服务。 关键操作管理 为了能够对弹性云服务器的操作进行查询、审计和
触发“调整配置”提醒的阈值为:云服务器在最近72小时内,开机时间超过36小时,且“CPU使用率”的中位数超过75%。 关于监控指标“CPU使用率”的详细描述,请参见弹性云服务器支持的基础监控指标。 本章节介绍当云服务器CPU偏高、超过阈值时,系统提示调整配置时的操作指导。 变更须知 当云服务器状态为“已冻结”时,不支持变更规格。
GPU实例故障处理流程 GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
单击管理控制台左上角的,选择区域和项目。 单击“”,选择“计算 > 弹性云服务器”。 在待迁移的弹性云服务器的“操作”列下,单击“更多 > 运维与监控 > 调整所属主机”。 在“调整所属主机”页面中,选择对应的专属主机。 如果无可选择的专属主机,需先完成专属主机资源的创建,详细内容,请参见购买专属主机。