检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用root用户登录主机。 执行如下命令,打开sysctl.conf文件。 vim /etc/sysctl.conf (永久修改)在sysctl.conf文件添加新的端口配置。 net.ipv4.ip_local_port_range=49152 65536 执行如下命令,使修改生效。 sysctl
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
well." 启动Agent(新版本) 执行以下命令,启动Agent。 /usr/local/uniagent/extension/install/telescope/telescoped start 重启Agent(新版本) 执行以下命令查看telescope的PID。 /usr/
其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 DNS 修改DNS(命令行方式) 本节介绍使用命令行方式添加域名解析地址至resolv.conf文件的操作步骤和方法。
BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 修改DNS(命令行方式) 本节介绍使用命令行方式添加域名解析地址至resolv.conf文件的操作步骤和方法。
使用root账号,登录ECS。 执行以下命令,切换至Agent安装路径的bin下。 cd /usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi
如果2中返回old agent,代表当前Agent为老版本,卸载命令参见卸载Agent(老版本)。 如果2中返回版本号,代表当前Agent为新版本,卸载命令参见卸载Agent(新版本)。 安装最新版本的Agent,安装命令参见操作步骤。 父主题: 升级Agent
务器。 执行如下命令,检查telescope进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。
服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: ntpdate -u ntp.myhuaweicloud.com 或使用其他ntp服务器替换ntp.myhuaweicloud.com
"cpu_second_pct_threshold": xx, "memory_second_threshold": xxx } 执行如下命令,保存并退出conf.json文件。 :wq 请执行如下命令,重启Agent。 Windows系统下: 在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start
置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
务器。 执行如下命令,检查telescope进程是否存在: ps -ef |grep telescope 当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。
计数。 使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。 使用ethtool -i <网口名>命令采集。 光模块信息 包括光模块的基本设备信
可选配置,根据企业项目ID过滤资源,不配置默认查询所有资源的指标,多个ID使用英文逗号进行分割。 logs_conf_path: "/root/logs.yml" # 可选配置,指定日志配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path:
主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。 前提条件 账号下已购买了EC
创建资源分组(V1) 功能介绍 创建资源分组。资源分组支持将各类资源按照业务集中进行分组管理,可以从分组角度查看监控与告警信息以提升运维效率。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
lescope进程不会被其他软件关闭。 操作步骤(单节点安装) 安装命令参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 操作步骤(多节点批量安装) 参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 安装lspci工具 登录弹性云服务器。
PowerShell。 执行以下命令,进入安装包存放路径(存放路径以"C:\Users\Administrator\Downloads"为例,执行命令时请修改为您机器上安装包存放的路径)。 cd C:\Users\Administrator\Downloads 执行以下命令,安装插件(执行时需
单纯的MetricName不是一个指标,不能标识任何东西。 错误码说明 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 模块 http状态码 错误码 错误码说明 Error Message 描述(处理措施) Cloud Eye通用 500 ces.0007