检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
执行以下命令,卸载已安装的Agent: bash /usr/local/uniagent/script/uninstall.sh 修改CES Cosole提供的Agent安装命令中的-u和-t参数,可修改-u参数为0.2.1,修改-t参数2.7.5进行安装。 以华东二安装命令为例:
使用root用户登录主机。 执行如下命令,打开sysctl.conf文件。 vim /etc/sysctl.conf (永久修改)在sysctl.conf文件添加新的端口配置。 net.ipv4.ip_local_port_range=49152 65536 执行如下命令,使修改生效。 sysctl
ES Agent日志发现指标上报正常。登录实例后执行命令“lscpu“查看返回值中包含乱码。 问题分析 CES Agent需要通过“lscpu”命令的返回值来确定实例是ECS/BMS,当实例系统语言为中文时,“lscpu”命令的返回值中有乱码,会导致CES Agent误将ECS错
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 DNS 修改DNS(命令行方式) 本节介绍使用命令行方式添加域名解析地址至resolv.conf文件的操作步骤和方法。
务器。 执行如下命令,检查telescope进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。
以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查Agent进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示Agent进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。 /us
置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
Linux平台修改DNS 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 修改DNS(命令行方式) 修改DNS(管理控制台方式) 本节以华北-北京一区域为例,介绍使用命令行方式添加域名解析地址至resolv.conf文件的操作步骤和方法。
"cpu_second_pct_threshold": xx, "memory_second_threshold": xxx } 执行如下命令,保存并退出conf.json文件。 :wq 请执行如下命令,重启Agent。 Windows系统下: 在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start
可选配置,根据企业项目ID过滤资源,不配置默认查询所有资源的指标,多个ID使用英文逗号进行分割。 logs_conf_path: "/root/logs.yml" # 可选配置,指定日志配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path:
计数。 使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。 使用ethtool -i <网口名>命令采集。 光模块信息 包括光模块的基本设备信
已支持一键安装的主机资源,可在界面直接点击“安装&升级插件”按钮,系统将自动识别可以进行一键安装的所有主机,进行批量安装插件。 远程安装 必须有可用的安装机,且安装机与需要安装插件的主机在同一VPC组内,确保安装机与待安装主机间网络互通才可进行远程安装,远程安装当前仅支持Linux操作系统的主机。 手动安装
well." 启动Agent(新版本) 执行以下命令,启动Agent。 /usr/local/uniagent/extension/install/telescope/telescoped start 重启Agent(新版本) 执行以下命令查看telescope的PID。 /usr/
服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: ntpdate -u ntp.myhuaweicloud.com 或使用其他ntp服务器替换ntp.myhuaweicloud.com
GPU。若您的机器支持GPU且驱动运行正常,请参考以下操作步骤升级插件为增强版: 卸载当前基础版Agent: Linux平台:登录机器执行命令 bash /usr/local/uniagent/script/uninstall.sh; Windows平台:在Agent安装包存放目录(“C:\Program
exists命令的平均时延 us redis038_exists_p99 exists命令的p99时延 us redis039_exists_qps exists命令的QPS Counts/Second redis040_expire_avg_usec expire命令的平均时延 us
如果2中返回old agent,代表当前Agent为老版本,卸载命令参见卸载Agent(老版本)。 如果2中返回版本号,代表当前Agent为新版本,卸载命令参见卸载Agent(新版本)。 安装最新版本的Agent,安装命令参见Linux系统。 使用具有“管理员”权限的账号(例如,ad