检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理显卡ERR!问题 问题描述 执行nvidia-smi命令,仅Pwr:Usage/Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。
执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev a1),请继续按照处理方法处理;如果查找不到显卡或者显示状态为rev ff,请根据显卡故障诊断及处理方法进行故障诊断。规格对应显卡数量可以通过GPU加速型查询。 lspci | grep -i nvidia 处理方法 非CCE集群场景,
如何处理驱动兼容性问题 问题描述 用户执行nvidia-smi命令回显报错“No devices were found”。 No devices were found 处理方法 查看云服务器的实例规格,确认用户使用的镜像信息。 如果使用NVIDIA Tesla T4 GPU(例如,Pi2或G6规格),请参见T4
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing,
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
有远程桌面授权服务器可以提供许可证,删除远程桌面服务。 配置多用户登录后,可能会出现多用户登录Windows主机时无法打开浏览器的问题,解决方法请参考多用户登录Windows主机时无法打开浏览器。 操作步骤 安装桌面会话主机和远程桌面授权 允许多用户远程连接云服务器 配置新用户并加入远程桌面用户组
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
如何处理Nouveau驱动未禁用导致的问题 问题描述 Nouveau驱动未禁用可能导致Linux系统卡死、虚拟机无法远程登录等问题。一般常见于客户使用自己的私有镜像(从ECS普通虚拟机导出的镜像或其他来源的私有镜像)。 判断方式 执行以下命令,查看Linux内核环缓冲区中的错误关键字信息。
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
资源灵活地绑定及解绑。拥有多种灵活的计费方式,可以满足各种业务场景的需要。 一个弹性公网IP只能绑定一个云资源使用。 图1 通过EIP访问公网 相关链接 绑定弹性公网IP 解绑弹性公网IP 修改弹性公网IP的带宽 弹性公网IP类常见问题 访问网站或应用故障类常见问题 父主题: 弹性公网IP管理
有远程桌面授权服务器可以提供许可证,删除远程桌面服务。 配置多用户登录后,可能会出现多用户登录Windows主机时无法打开浏览器的问题,解决方法请参考多用户登录Windows主机时无法打开浏览器。 操作步骤 安装桌面会话主机和远程桌面授权 允许多用户远程连接云服务器 配置新用户并加入远程桌面用户组
如何处理用户安装了GRID驱动,但未购买、配置License问题 问题描述 用户业务是做图形处理的,且用户已经安装了GRID驱动,但用户的GPU使用率很低或渲染性能达不到预期。 例:运行图像识别任务,任务会突然卡住无法继续运行,GPU的性能表现差;查看/var/log/messa
备份弹性云服务器 按需转包年/包月 管理云服务器标签 调整配额 运维与监控 查看监控指标 创建告警规则 支持云审计的关键操作 查看审计日志 常见问题 了解更多常见问题、案例和解决方案 热门案例 无法连接Windows实例怎么办? 无法连接Linux实例怎么办? 无法访问ECS实例上运行的网站怎么办?
弹性云服务器关机后还会计费吗? “故障”状态的弹性云服务器还会计费吗? 包年/包月和按需计费模式是否支持互相切换? 云服务器资源冻结/释放/删除/退订常见问题 弹性云服务器怎样停止计费? 竞价计费型实例常见计费问题 父主题: 计费FAQ
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
Enclave简介 快速入门 典型使用案例 密码学证明 QingTian Enclave应用开发 QingTian CLI(qt CLI) 错误码 常见问题
驱动类型、驱动版本。 如客户选择自行安装Tesla驱动,请务必告知客户确保Tesla驱动与CUDA软件的版本配套关系,可参考Tesla驱动及CUDA工具包获取方式。 处理方法 如果用户未安装驱动,请自行安装驱动,或切换带驱动的公共镜像,或使用驱动自动安装脚本安装驱动。 GPU加速型实例自动安装GPU驱动(Linux)
购买弹性云服务器 概述 步骤一:基础配置 步骤二:网络配置 步骤三:高级配置 步骤四:确认配置
搭建Discuz! 论坛网站 方案概述 资源和成本规划 搭建Discuz! 论坛网站操作流程 实施步骤 父主题: 搭建网站
实施步骤 购买服务 搭建网站 配置特性 访问网站 父主题: 搭建Discuz! 论坛网站