检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
控指标和ECS自带的监控指标。 操作系统监控指标和基础监控指标请参见云产品监控指标。 前提条件 已完成Agent插件的安装。安装请参考Agent安装说明进行安装。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 查看ECS或BMS的监控指标: 支持企业项目的服务,
返回“0”,表示未安装Agent。 卸载当前版本的Agent。 如果2中返回old agent,代表当前Agent为老版本,卸载命令参见卸载Agent(老版本)。 如果2中返回版本号,代表当前Agent为新版本,卸载命令参见卸载Agent(新版本)。 安装最新版本的Agent,安装命令参见Linux系统。
如何查看数据盘的磁盘使用率和创建告警通知? 磁盘使用率指标需要您安装主机监控Agent。安装Agent后,如果需要创建磁盘使用率的告警通知,请在创建主机监控的告警规则时,告警策略选择“(Agent)磁盘使用率(推荐)”,并选择磁盘挂载点。 安装Agent后,您可以在管理控制台查看数据盘的磁盘使
存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windows系统下,路径为:“C:\Program
如何配置委托? 为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Age
返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 操作步骤 使用root用户登录主机。 执行如下命令,打开sysctl.conf文件。 vim /etc/sysctl.conf (永久修改)在sysctl.conf文件添加新的端口配置。 net.ipv4.ip_local_port_range=49152
主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过1
提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES Exporter。 具体操作请参考安装配置CES Exporter。 下载、安装并配置Prometheus。 具
制作的私有镜像不可跨Region使用,因为跨Region使用私有镜像创建的ECS实例无法取得监控数据。 前提条件 已有安装Agent的ECS实例。 操作步骤 进入ECS控制台的实例管理页面,单击该实例右侧的“更多 > 关机”,将已安装Agent的ECS实例关机,如图1所示。 图1 关机 单击该实例右侧的“更多 > 镜像/磁盘/备份
安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。
Agent插件状态显示“运行中”但没有数据该如何处理? Agent安装完成后请等待10分钟,若仍然无数据,一般为conf文件中InstanceId配置错误。 请参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 父主题: 主机监控
为了更加安全高效的使用云监控服务提供的主机监控功能,我们提供了最新方式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
“添加进程监控”,进入“添加自定义进程监控”页面,配置进程名称或进程名关键字,如图1所示。 图1 添加自定义进程监控 “进程数量”在配置自定义监控时不需要配置,在您配置进程关键字后系统随后会自动刷新展示匹配关键字的进程数量。 配置完成后,您可以在“进程监控”页面的“自定义进程监控”区域框查看您设置的自定义进程的数量。
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
ECS规格建议Linux使用“2vCPUs | 4GiB”、Windows使用“4vCPUs | 8GiB”或更高配置。 Linux操作系统安装插件需要root权限;Windows操作系统安装插件需要管理员权限。 约束限制 主机监控仅针对于华为云公共镜像提供监控服务,如您是私有镜像,使用过程中
让出CPU,导致CPU占用异常。 可通过执行cat /proc/cmdline命令查看您的操作系统(Guest OS)是否配置了idle=poll。 若想要查看操作系统(Guest OS)内部是否配置了idle=mwait,请联系技术支持。 SAP HANA(High-Performance
表页面有用户安装指南,可进行参考: 直接单击单台资源“未安装”即可弹出操作指导,根据操作指南登录机器后使用安装命令进行插件安装即可。 图1 安装插件指引 官网文档也可参考安装Agent(Windows)。 Linux类型的机器目前安装Agent支持单台安装和批量安装。目前部分机器
服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: ntpdate -u ntp.myhuaweicloud.com 或使用其他ntp服务器替换ntp.myhuaweicloud.com
什么是插件修复配置? 安装Agent插件后,修复插件配置为用户提供了一键配置AK/SK、RegionID、ProjectId的功能,省去了繁琐的手动配置步骤,提升配置效率。 目前大部分区域已上线一键式授予该区域插件权限功能,即自动修复插件配置。您可以单击“主机监控 - 弹性云服务