检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
执行nvidia-smi命令,查看驱动版本,并对照版本配套关系。 版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。 若显示适配器恢复正常,则恢复完成。 若仍异常,则执行下一步。 请尝试重装GPU驱动或升级驱动版本。请参考安装GPU驱动。
选择“中国-香港”区域 优化访问速度 您还可以按照本节的操作步骤优化访问速度。 修改DNS配置 修改hosts文件来优化访问速度 优化访问速度后,您可以进一步通过执行ping -t 网站地址确认丢包情况,详细操作请参考检查访问网站的请求是否得到响应。 修改DNS配置 方法一:系统界面操作
选择“中国-香港”区域 优化访问速度 您还可以按照本节的操作步骤优化访问速度。 修改DNS配置 修改hosts文件来优化访问速度 优化访问速度后,您可以进一步通过执行ping -t 网站地址确认丢包情况,详细操作请参考检查访问网站的请求是否得到响应。 修改DNS配置 方法一:系统界面操作
受内存加载速度的影响,超大内存型弹性云服务器可能需要较长的启动时间。 E1型、E2型弹性云服务器支持挂载如下类型的云硬盘作为系统盘和数据盘: 高IO (性能优化Ⅰ型) 超高IO (时延优化) 超大内存型弹性云服务器主网卡和扩展网卡的使用场景如表5所示。 表5 超大内存型弹性云服务器网卡的使用场景 网卡类型 使用场景
ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc error,执行nvidia-smi
可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile Uncorr. ECC下ecc error > 0,执行nvidia-smi
执行以下命令,编辑配置文件“/etc/cloud/cloud.cfg”。 sudo vim /etc/cloud/cloud.cfg 选择如下方法,修改配置文件。 方法一:修改或添加“preserve_hostname”参数项。 如果文件“/etc/cloud/cloud.cfg”中已有参数项“preserve_hostname:
正则排序:按照name_prefix[begin_number,bits]name_suffix格式为多台云服务器设置有序的名称。 本节操作分别介绍两种命名方式的使用方法。 自动排序 名称可自定义,但需符合命名规则:只能由中文字符、英文字母、数字及“_”、“-”组成,且长度为[1-64]个字符。 一次创建多
如果回显PowerShell无法加载文件,原因是通过网络下载的PowerShell脚本在未签名的情况下,Windows系统策略会禁止执行。 您可以通过以下方法解决:首先执行命令set-ExecutionPolicy RemoteSigned,然后重启PowerShell即可。 (可选)在“磁盘管理”页面,可以查看初始化结果。
云服务器内存不足。 处理方法 方法一(推荐): 变更规格,升级云服务器的CPU、内存大小。变更规格的方法,请参见变更规格(CPU和内存)。 方法二: 开启虚拟内存,获取云服务器的空闲内存。 开启虚拟内存的方法,请参见怎样配置Windows弹性云服务器的虚拟内存?。 该方法会导致磁盘I/O性能下降,如非必要,不推荐使用。
堆栈日志信息 可能原因 云服务器在运行过程中遇到NVIDIA官方驱动bug,导致云服务器内核崩溃。 处理方法 方法一:重启云服务器。 重启后,云服务器可以正常使用,该问题再次发生概率通常较低。 方法二:更新驱动版本。 如果云服务器重启后,该问题依然出现,则需要通过NVIDIA官方下载对应CUDA驱动版本的最新版本。
弹性云服务器安装图形化界面前,请确保云服务器内存不小于2GB,否则可能出现图形化界面安装失败,或安装后无法启动的问题。 x86架构的CentOS 6镜像源更换方法请参考如何使用自动化工具配置华为云镜像源(x86_64和鲲鹏)?。 操作步骤 执行以下命令,查看当前操作系统提供的安装组件。 yum groupinstall
2021年4月 序号 功能名称 功能描述 阶段 相关文档 1 内存优化型,新增规格m6.22xlarge.8.physical 内存优化型,新增裸金属类型规格m6.22xlarge.8.physical。 商用 内存优化型 2021年2月 序号 功能名称 功能描述 阶段 相关文档 1
了解微软官方列举的bugcheck code解决方案。 处理方法 建议不要安装来源不明的软件,使用正版软件,推荐使用Windows2012操作系统。 如果是通过外部镜像创建的服务器,请参考《镜像服务用户指南》中“优化Windows私有镜像”章节优化私有镜像。 排查是否是因为CPU占用过高导致的
host_ed25519_key。 场景四:内核参数优化 以配置vm.nr_hugepages参数为例,操作步骤如下: 在正常实例上,执行以下命令,对数据盘中的/mnt/etc/sysctl.conf文件中的内核参数进行配置优化。 vim /mnt/etc/sysctl.conf
{server_group_id} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 server_group_id 是 弹性云服务器组UUID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数
两种系统都可以选。 Windows的版本越高越好吗? Windows2012、Windows2016、Windows2019操作系统网络优化和系统兼容性比较好,建议选择最高版本Windows2019。 Linux操作系统的版本怎么选? Linux提供了多种操作系统和版本,不同操
器查看GPU使用率。 本节操作介绍了两种查看GPU使用率的方法,方法一是在cmd窗口执行命令查看GPU使用率,方法二是通过安装gpu-Z工具查看GPU使用率。 前提条件 GPU加速型云服务器已安装NVIDIA驱动。 方法一 登录GPU加速型云服务器。 打开cmd命令窗口。 执行如下命令,查看GPU使用情况。
1/{project_id}/os-server-groups 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 请求消息 请求参数如表2所示。 表2 请求参数 参数 是否必选 参数类型 描述 server_group 是 Object