搜索_华为云

创建安全组规则（废弃） - 弹性云服务器 ECS

创建安全组规则（废弃）功能介绍创建安全组规则。当前API已废弃，请使用“创建安全组规则”。 URI POST /v2.1/{project_id}/os-security-group-rules 参数说明请参见表1。表1 参数说明参数是否必选描述 project_id

帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 安全组管理（OpenStack Nova API）
如何处理GPU掉卡问题 - 弹性云服务器 ECS

如何处理GPU掉卡问题问题描述执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。如上图所示，执行nvidia-smi命令查询到7张显卡，实际该机型应有8张显卡。判断方式执行以下命令，显卡的数量与实际规格对应的显卡数量一致，且显卡在位状态正常（rev

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何使用自动化工具配置华为云镜像源(x86_64和鲲鹏)？ - 弹性云服务器 ECS

中国-香港。请确认已经配置了华为云提供的内网DNS服务器地址。华为云内网DNS地址，请参见华为云提供的内网DNS地址是多少。配置DNS地址请参考如何为ECS配置DNS？。本节操作适用于x86_64架构和鲲鹏架构的云服务器。当前支持的操作系统版本包括：EulerOS、CentOS、Debian、Ubuntu。

帮助中心 > 弹性云服务器 ECS > 常见问题 > 镜像源管理
Linux实例执行命令或启动服务时出现错误：Cannot allocate memory - 弹性云服务器 ECS

Linux实例执行命令或启动服务时出现错误：Cannot allocate memory 问题描述 Linux操作系统的ECS实例内存充足，但是在执行命令或启动服务时，出现错误提示“Cannot allocate memory”。命令及执行结果如下： root@localhost:~#

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
pip安装软件时出现错误：command ´gcc´ failed with exit status 1 - 弹性云服务器 ECS

pip安装软件时出现错误：command ´gcc´ failed with exit status 1 问题描述安装Python库软件时，需配置pip源。以中国科技大学镜像源为例： [root@test home]# cat /root/.pip/pip.conf [global]

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
查询API版本信息列表（废弃） - 弹性云服务器 ECS

查询API版本信息列表（废弃）功能介绍返回Nova当前所有可用的版本。为了支持功能不断扩展，Nova API支持版本号区分。Nova中有两种形式的版本号： "主版本号": 具有独立的url。 "微版本号": 通过Http请求头X-OpenStack-Nova-API-Version来使用，从

 帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 查询API版本信息（OpenStack Nova API）
Web访问超时系统日志打印：nf_conntrack:table full, dropping packet - 弹性云服务器 ECS

Web访问超时系统日志打印：nf_conntrack:table full, dropping packet 问题现象客户端访问web时出现time out。服务端系统日志/var/log/messages打印kernel: nf_conntrack:table full, dropping

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
如何处理可恢复的Xid故障问题 - 弹性云服务器 ECS

如何处理可恢复的Xid故障问题问题原因 Xid 说明 13 Graphics Engine Exception，非硬件故障，可能是指令错误等。 31 GPU memory page fault，非硬件故障，可能访问了非法地址等。 43 GPU stopped processing，

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

communicate with the NVIDIA diver。判断方式执行以下命令，查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令，查看安装驱动时的内核版本。 CentOS：find /usr/lib/modules -name nvidia.ko Ubuntu：find

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

配置License。如果用户已购买过License，但是未配置License，请参考GPU加速型实例安装GRID驱动配置License服务器与License文件。父主题：非硬件故障自恢复处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
EIP资源在什么情况下会被冻结，如何解除被冻结的EIP资源？ - 弹性云服务器 ECS

EIP资源绑定的服务器如果对外有攻击等安全违规行为，即被冻结状态，在控制台上显示为冻结（违规冻结）。被冻结的资源不可用，也不能修改、删除。若要解除冻结状态，请提交工单。您可以参考更换弹性公网IP为实例更换EIP。 EIP绑定的实例涉嫌违规被冻结 EIP资源绑定的服务器涉嫌违规行为，

帮助中心 > 弹性云服务器 ECS > 常见问题 > 弹性公网IP类
Linux操作系统执行passwd命令重置密码失败提示：Authentication token manipulation error - 弹性云服务器 ECS

Linux操作系统执行passwd命令重置密码失败提示：Authentication token manipulation error 问题现象 root用户用passwd命令修改管理员用户以及普通用户的密码时失败，提示passwd:Authentication token manipulation

帮助中心 > 弹性云服务器 ECS > 故障排除 > 密码与密钥对
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因总线脱落。内核版本不一致。问题影响显卡驱动安装失败，显卡无法使用。处理方法执行以下命令，查看内核版本，检查内核版本是否一致。 rpm -qa | grep

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高问题原因显卡散热异常、风扇损坏。问题影响显卡温度过高，影响用户业务。处理方法执行nvidia-smi命令，查看风扇是否正常。如果风扇转速为0，说明风扇可能存在损坏，用户停止业务，执行业务迁移后，根据故障

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡）问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令查看显卡信息。如果在volatile Uncorr. ECC下发现存在ecc

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题问题描述用户使用不带驱动的公共镜像或私有镜像，自行安装NVIDIA驱动软件包、CUDA软件包，在安装过程中脚本执行报错。判断方式确认用户使用的镜像文件。确认用户的NVIDIA软件包来源。确认用户想要的

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错：Failed to restart

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题问题描述用户业务是做渲染（推理）的，但用户选择了带Tesla驱动（GRID驱动）的公共镜像，运行软件时出错。例：用户使用场景为做渲染，但选错公共镜像，运行软件时报错“A D3D11-compatible GPU (Feature

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因某种健全性检查没有通过，GPU驱动程序不会使用或信任其内容（某些内容未被使用）。问题影响可能影响ECC相关非易失数据的记录，从而导致本该隔离的GPU内存页面继续使用。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页问题原因显存可能某个地方存在异常。问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令，查看显卡信息。如果在volatile

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法

总条数： 1200

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建安全组规则（废弃） - 弹性云服务器 ECS

如何处理GPU掉卡问题 - 弹性云服务器 ECS

如何使用自动化工具配置华为云镜像源(x86_64和鲲鹏)？ - 弹性云服务器 ECS

Linux实例执行命令或启动服务时出现错误：Cannot allocate memory - 弹性云服务器 ECS

pip安装软件时出现错误：command ´gcc´ failed with exit status 1 - 弹性云服务器 ECS

查询API版本信息列表（废弃） - 弹性云服务器 ECS

Web访问超时系统日志打印：nf_conntrack:table full, dropping packet - 弹性云服务器 ECS

如何处理可恢复的Xid故障问题 - 弹性云服务器 ECS

如何处理升级内核后，驱动不可用问题 - 弹性云服务器 ECS

如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

EIP资源在什么情况下会被冻结，如何解除被冻结的EIP资源？ - 弹性云服务器 ECS

Linux操作系统执行passwd命令重置密码失败提示：Authentication token manipulation error - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi存在SRAM的ECC错误（V100显卡） - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线