检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主题请参见创建主题。 CPU使用率、内存使用率、磁盘使用率等为ECS基础监控的指标。(Agent)使用率、(Agent)内存使用率、(Agent)磁盘使用率等为细粒度(分钟级)监控指标。 建议针对(Agent)CPU使用率、(Agent)内存使用率、(Agent)磁盘使用率可配置
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标
t占用CPU或内存过高时,提供了熔断机制。当Agent负载过高时,会自动触发熔断,触发熔断机制后,Agent暂时停止工作,不上报监控数据。 熔断机制原理 默认情况下,Agent检测机制为: 1分钟查检测一次Agent是否超过第二阈值(占用CPU超过30%或占用内存超过700M)。
CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 父主题: 主机监控
<dev_id>命令采集。 HiNIC网卡PCIE误码统计 HiNIC网卡PCIE误码各项统计。 使用hinicadm counter -i <dev_id> -t 4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息
资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent会主动触发
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
well." 启动Agent(新版本) 执行以下命令,启动Agent。 /usr/local/uniagent/extension/install/telescope/telescoped start 重启Agent(新版本) 执行以下命令查看telescope的PID。 /usr/
S上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可设置CPU使用率>80%、内存使用率>80%、磁盘使用率>80%,以下以CPU使用率为例。
procGlobalMemoryStatusEx获取内存总量,通过GetProcessMemoryInfo获取内存已使用量,计算两者比值得到内存使用率。 打开文件数 进程消耗的打开文件数。 ≥ 0 测量对象:云服务器或裸金属服务器 通过执行ls -l /proc/pid/fd命令可以查看数量。 测量对象:云服务器或裸金属服务器
使用root账号,登录ECS。 执行以下命令,切换至Agent安装路径的bin下。 cd /usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi
个数得到。用户可以通过top命令查看load15值。 无 2.4.1 1分钟 操作系统监控指标: 内存 指标 指标名称 指标说明 单位 支持版本 监控周期(原始指标) mem_available (Agent)可用内存 该指标用于统计测量对象的可用内存。 采集方式(Linux):
如果2中返回old agent,代表当前Agent为老版本,卸载命令参见卸载Agent(老版本)。 如果2中返回版本号,代表当前Agent为新版本,卸载命令参见卸载Agent(新版本)。 安装最新版本的Agent,安装命令参见操作步骤。 父主题: 升级Agent
关系型数据库 SYS.RDS √ 配置审计 弹性负载均衡 SYS.ELB √ 弹性负载均衡 云数据库 GaussDB(for MySQL) SYS.GAUSSDB √ 配置审计 云数据库 GaussDB(for openGauss) SYS.GAUSSDBV5 √ 云数据库 GaussDB(for
× × 工作流 √ × × × × 云数据库 GaussDB GAUSSDB 云数据库 GaussDB实例 √ × × × × 云数据库 GaussDB(for MySQL) GaussDB(for MySQL) GaussDBforMySQL实例 √ √ √ √ √ 全域弹性公网IP和带宽
服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: ntpdate -u ntp.myhuaweicloud.com 或使用其他ntp服务器替换ntp.myhuaweicloud.com
以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查Agent进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示Agent进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。 /us
置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误