检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
如何处理infoROM错误 问题描述 Linux操作系统的云服务器在执行nvidia-smi命令报错“WARNING:infoROM is corrupted at gpu 0000:00:0D.0”,并且用户业务已经受到影响。 问题原因 健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。
GPU实例故障处理流程如图1所示,对应的操作方法如下: CES监控事件通知:配置GPU的CES监控后会产生故障事件通知。 故障信息收集:可使用GPU故障信息收集脚本一键收集,也可参考故障信息收集执行命令行收集。 GPU实例故障分类列表:根据错误信息在故障分类列表中识别故障类型。
conf 执行以下命令,使配置生效。 sysctl -p 调优limits参数 以启动报错业务进程的用户登录云服务器,执行以下命令查询当前配置参数。 ulimit -u 执行以下命令,根据业务需求和当前值评估,配置合适的nproc上限。 以root用户nproc配置100000为例:
填写DNS服务器IP地址 方法二:命令行操作 以下演示了Windows 2012操作系统通过命令行配置DNS的操作步骤。 登录Windows云服务器。 单击左下角的“开始”菜单,输入“notepad”,运行记事本应用。 拷贝表1中的脚本内容到记事本中,并另存为bat脚本文件。 表1 配置DNS脚本内容
填写DNS服务器IP地址 方法二:命令行操作 以下演示了Windows 2012操作系统通过命令行配置DNS的操作步骤。 登录Windows云服务器。 单击左下角的“开始”菜单,输入“notepad”,运行记事本应用。 拷贝表1中的脚本内容到记事本中,并另存为bat脚本文件。 表1 配置DNS脚本内容
Firmware,导致GPU无法识别。 处理方法一 该处理方法在重启云服务器后失效。 执行以下命令,移除NVIDIA内核模块。 rmmod nvidia_drm rmmod nvidia_modeset rmmod nvidia 执行以下命令,关闭GSP Firmware开关,并载入NVIDIA内核模块。 modprobe
DNS服务器地址”,如图6所示,根据需要配置DNS。DNS服务器东北区IP地址为100.125.6.250,其它区域详情请参见华为云内网DNS地址。配置完成后,单击“确定”,完成配置。 图6 Windows系统配置DNS 父主题: 网络配置
PU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。 dmesg | grep -i xid 若检查项GPU节点上的XID异常为空,说明无XID消息。
Cloud-init配置文件中,使之永久生效。 假设修改后的主机名为“new_hostname”。 修改配置文件“/etc/hostname”。 执行以下命令,编辑配置文件“/etc/hostname”。 sudo vim /etc/hostname 修改配置文件,将文件中的主机
以root用户登录云服务器。 执行以下命令,查询磁盘信息。 fdisk -l | grep 'Disk /dev/' 图1 查询磁盘信息 如图1所示,云服务器共有3块磁盘:/dev/vda、/dev/vdb、/dev/vdc。 执行以下命令,查看磁盘挂载情况。 df -h| grep
搭建环境 搭建LNMP环境 搭建LAMP环境 搭建Java Web环境 镜像部署Windows环境 手工搭建Hadoop环境(Linux) 手工部署Node.js(CentOS 7.2)
本地。 通过puttygen.exe工具创建成功的密钥对,还需要执行导入密钥对,导入系统才能正常使用密钥对。 操作步骤 在以下路径中下载并安装PuTTY和PuTTYgen。 https://www.chiark.greenend.org.uk/~sgtatham/putty/latest
hostname02 按“Esc”退出编辑模式。 执行以下命令,保存并退出。 :wq 登录ecs-02。 重复执行3.b~3.g。 测试验证能否通过主机名正常通信。 分别登录同一VPC内的弹性云服务器,执行以下命令,使用ping命令ping添加的主机,看ping包是否能正常送达。 ping
由于在安全软件中设置了安全登录限制,导致远程桌面连接Windows云服务器报错:无法验证此远程计算机的身份。需要再次登录输入密码。 图1 协议错误 可能原因 云服务器安装了安全软件,防止有未知IP登录云服务器。 解决方法 卸载安全软件。 登录安全软件,将登录安全等级修改为系统默认登录方式。 父主题: Windows远程登录报错类
conf,添加或者修改下列两行。 net.ipv4.tcp_tw_recycle = 0 net.ipv4.tcp_tw_reuse = 0 执行以下命令,使修改的配置生效。 sysctl -p 启动中修改内核参数可能存在内核加载该参数不稳定的情况,建议在合适的时间进行重启。 父主题: SSH连接
是apache产生的访问日志文件,从日志大小判断是很久没有清理的apache日志文件了。 执行以下命令删除access_log。 rm /tmp/access_log 执行以下命令查看文件系统使用率。 df -h 删除该文件后使用df查看文件系统使用率仍是96%。 根因分析 通常
在“镜像”设置时,可以选择“公共镜像”和“私有镜像”。 公共镜像:已经默认安装了CANN 3.1.0的开发套件包,并配置了环境变量,请验证环境的可用性。 私有镜像:需要安装驱动、固件和开发套件,并配置环境变量。详细步骤,请参考昇腾文档中心对应版本的《CANN软件安装指南》。 远程登录云服务器。 对于Linux
搭建Java Web环境 镜像部署Java Web环境 基于Tomcat构建Java web环境(CentOS 7.4) 基于Tomcat构建Java web环境(Huawei Cloud EulerOS 2.0) 父主题: 搭建环境
查询任务的执行状态 功能介绍 查询一个异步请求任务(Job)的执行状态。 对于创建云服务器、删除云服务器、云服务器批量操作和网卡操作等异步API,命令下发后,会返回任务ID(Job_id),通过Job_id可以查询本次异步请求任务的执行状态。 如何获取job_id,请参考响应(任务类)。