搜索_华为云

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

s.nvidia.com/deploy/xid-errors/index.html。处理方法执行dmesg | grep –i xid命令，查看是否存在xid报错。通知用户停止业务，执行业务迁移，并根据故障信息收集章节收集故障信息后，联系技术支持处理。父主题：显卡故障诊断及处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
远程连接Linux云服务器报错：Module is unknown - 弹性云服务器 ECS

修改ro为rw，以读写方式挂载根分区。并添加rd.break，然后执行Ctrl+X。图3 修改前图4 修改后执行以下命令切换至/sysroot目录。 chroot /sysroot 执行以下命令，查看系统日志定位出错的文件 grep Module /var/log/messages 图5 系统日志

 帮助中心 > 弹性云服务器 ECS > 常见问题 > 远程登录 > Linux远程登录报错类
如何收集NVIDIA日志 - 弹性云服务器 ECS

如何收集NVIDIA日志收集NVIDIA日志方法如下：登录弹性云服务器。在任意目录下执行以下命令。（如果是CCE场景，进入到/opt/cloud/cce/nvidia/bin目录后执行） sh nvidia-bug-report.sh 或 ./nvidia-bug-report

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 故障信息收集
使用Xshell连接不上云服务器，提示“WARNING! The remote SSH server rejected X11 forwarding request.”报错 - 弹性云服务器 ECS

登录弹性云服务器。执行以下命令，编辑/etc/ssh/sshd_config文件。 vi /etc/ssh/sshd_config 修改如下配置项： X11Forwarding参数修改为：yes UseLogin参数去掉前面的注释，并修改取值为no 修改结果如下图所示：执行以下命令，重启ssh服务。

帮助中心 > 弹性云服务器 ECS > 故障排除 > 远程登录 > Linux远程登录报错类
CentOS 7中修改fstab无法挂载怎么办？ - 弹性云服务器 ECS

根因分析执行以下命令，查询有问题的mount unit。 systemctl list-units --type=mount |grep failed test1.mount loaded failed failed /test1 执行以下命令，查询该unit的状态。

帮助中心 > 弹性云服务器 ECS > 故障排除 > 磁盘空间管理
如何处理显卡ERR！问题 - 弹性云服务器 ECS

如何处理显卡ERR！问题问题描述执行nvidia-smi命令，仅Pwr:Usage/Cap（能耗）显示ERR！处理方法如果当前用户业务正常，仅nvidia-smi执行后存在ERR!显示问题，无需处理。如果当前业务已经受到影响，迁移虚拟机，再根据故障信息收集收集故障信息后联系技术支持处理。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
获取ECS一键式重置密码插件 - 弹性云服务器 ECS

如果表1中不包含您的弹性云服务器所在区域，请您为弹性云服务器绑定EIP，然后选择就近区域进行下载。绑定EIP的详细操作，请参见绑定弹性公网IP。以管理员权限打开cmd，执行以下命令，获取本地一键式重置密码插件的Hash值。 certutil –hashfile {软件包本地目录}\CloudResetPwdAgent

帮助中心 > 弹性云服务器 ECS > 用户指南 > 密码和密钥对管理 > 管理ECS一键式重置密码插件
关闭Selinux - 弹性云服务器 ECS
关闭Selinux - 弹性云服务器 ECS

操作步骤执行以下命令，在vi编辑器中打开“/etc/selinux/config”。 vi /etc/selinux/config 按“i”进入编辑模式，修改SELINUX=disabled。修改完成后，按“Esc”，输入:wq保存并退出文件编辑。执行以下命令，重启云服务器，使修改生效。

帮助中心 > 弹性云服务器 ECS > 常见问题 > 密码与密钥对
如何查看和修改Linux弹性云服务器的内核参数？ - 弹性云服务器 ECS

以查看net.ipv4.tcp_tw_recycle的值为例，执行以下命令： cat /proc/sys/net/ipv4/tcp_tw_recycle 方法二：通过“/etc/sysctl.conf”文件进行查看。执行以下命令，查看当前系统中生效的所有参数。 /usr/sbin/sysctl

帮助中心 > 弹性云服务器 ECS > 常见问题 > 网络配置
ECS搭建网站入门 - 弹性云服务器 ECS

云市场中的模板是华为云合作伙伴提供的专业建站模板，可以通过云市场购买合适的模板，部署时间短，过程简单，后台管理方便，且有专人提供网站维护支持。适用于需求简单，云市场模板可以满足需求的个人或者中小企业用户。有PC、手机、微信等多种渠道可选择，部署使用简单，成本较低。云市场网站定制华为云市场是一个云上的软件和服务

 帮助中心 > 弹性云服务器 ECS > 最佳实践
怎样使修改的静态主机名永久生效？ - 弹性云服务器 ECS

_hosts: false”。 manage_etc_hosts: false 执行以下命令，保存并退出文件。 :wq 执行以下命令，重启弹性云服务器。 sudo reboot 执行以下命令，验证主机名和hosts的修改是否永久生效。 sudo hostname sudo cat

帮助中心 > 弹性云服务器 ECS > 常见问题 > ECS故障
GPU驱动不可用 - 弹性云服务器 ECS

根据不同的系统在服务器中执行如下命令，查看安装驱动时的内核版本： CentOS：find /usr/lib/modules -name nvidia.ko Ubuntu：find /lib/modules -name nvidia.ko 示例：以CentOS为例，执行上述命令，回显信息如图2所示可以看出GPU驱动是基于3

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU驱动故障
通过SSH密钥方式登录Linux ECS - 弹性云服务器 ECS

钥文件是kp-123.pem为例进行介绍。在您的linux计算机的命令行中执行如下命令，变更权限。 chmod 400 /path/kp-123.pem 上述命令的path为密钥文件的存放路径。执行如下命令，登录弹性云服务器。 ssh -i /path/kp-123.pem 默认用户名@弹性公网IP

帮助中心 > 弹性云服务器 ECS > 用户指南 > 实例 > 登录Linux ECS
如何查询NVIDIA的错误信息 - 弹性云服务器 ECS

如何查询NVIDIA的错误信息查询NVDIA错误信息的方法如下：登录弹性云服务器。执行以下命令，查看是否存在error信息，保存回显结果。 dmesg | grep -i nvidia 也可过滤关键字后保存结果，例如：NVRM、nouveau、nvidia、nv字样等。父主题：

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 故障信息收集
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

error错误，并无待隔离页问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令，查看显卡信息。如果在volatile Uncorr. ECC下ecc error > 0，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
故障信息收集方法 - 弹性云服务器 ECS

com/release/script/diagnose_gpu.sh 执行bash diagnose_gpu.sh命令，将信息收集到信息文件diagnose_gpu_xxxxx.tar.gz进行自排查或工单联系技术支持。使用命令获取信息请参考表1。表1 获取信息方法信息分类相关文档显卡基本信息如何获取显卡ID

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 故障信息收集
远程连接Linux云服务器报错：Authentication failed - 弹性云服务器 ECS

failed报错，重新设置过期账号密码或调整账号过期时间即可。处理方法方法一：以root用户登录Linux云服务器。执行以下命令，重置过期账号的密码。 chage -l 过期账号方法二：执行以下命令，调整账号过期时间。 chage -E 过期时间过期账号父主题： Linux远程登录报错类

 帮助中心 > 弹性云服务器 ECS > 故障排除 > 远程登录 > Linux远程登录报错类
Linux如何创建swap分区/swap文件 - 弹性云服务器 ECS

Syncing disks. 执行以下命令，将新建的分区创建为swap。 mkswap /dev/vdb1 执行以下命令，激活swap分区。 swapon /dev/vdb1 执行以下命令，查询已启动的swap。 swapon -s 执行以下命令，查询swap分区UUID。 blkid

帮助中心 > 弹性云服务器 ECS > 故障排除 > 磁盘空间管理
如何将扩容系统盘的空白分区在线扩容到末尾的root分区？ - 弹性云服务器 ECS

TYPE="ext4" 执行以下命令，安装growpart工具。工具growpart可能集成在cloud-utils-growpart/cloud-utils/cloud-initramfs-tools/cloud-init包里，可以直接执行命令yum install clou

帮助中心 > 弹性云服务器 ECS > 常见问题 > 磁盘分区/挂载/扩容
如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

100显卡）问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令查看显卡信息。如果在volatile Uncorr. ECC下发现存在ecc error，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法

总条数： 405

上一页
1
...
7
8
9
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

远程连接Linux云服务器报错：Module is unknown - 弹性云服务器 ECS

如何收集NVIDIA日志 - 弹性云服务器 ECS

使用Xshell连接不上云服务器，提示“WARNING! The remote SSH server rejected X11 forwarding request.”报错 - 弹性云服务器 ECS

CentOS 7中修改fstab无法挂载怎么办？ - 弹性云服务器 ECS

如何处理显卡ERR！问题 - 弹性云服务器 ECS

获取ECS一键式重置密码插件 - 弹性云服务器 ECS

关闭Selinux - 弹性云服务器 ECS

如何查看和修改Linux弹性云服务器的内核参数？ - 弹性云服务器 ECS

ECS搭建网站入门 - 弹性云服务器 ECS

怎样使修改的静态主机名永久生效？ - 弹性云服务器 ECS

GPU驱动不可用 - 弹性云服务器 ECS

通过SSH密钥方式登录Linux ECS - 弹性云服务器 ECS

如何查询NVIDIA的错误信息 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

故障信息收集方法 - 弹性云服务器 ECS

远程连接Linux云服务器报错：Authentication failed - 弹性云服务器 ECS

Linux如何创建swap分区/swap文件 - 弹性云服务器 ECS

如何将扩容系统盘的空白分区在线扩容到末尾的root分区？ - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线