搜索_华为云

如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

如何处理用户安装了GRID驱动，但未购买、配置License问题问题描述用户业务是做图形处理的，且用户已经安装了GRID驱动，但用户的GPU使用率很低或渲染性能达不到预期。例：运行图像识别任务，任务会突然卡住无法继续运行，GPU的性能表现差；查看/var/log/messages日志发现有如下报错，

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
Web访问超时系统日志打印：nf_conntrack:table full, dropping packet - 弹性云服务器 ECS

后在合理的时间重启系统，请评估风险后操作。根因分析 iptables的connection-tracking模块使用系统内存的一部分来跟踪表中的连接。“table full, dropping packet”表明连接跟踪表已满，不能为新连接创建新的条目，因为没有更多的空间。因此出现“dropping

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
查询SSH密钥列表（废弃） - 弹性云服务器 ECS

查询SSH密钥列表（废弃）功能介绍查询SSH密钥信息列表。当前API已废弃，请使用查询SSH密钥对列表。调试您可以在API Explorer中调试该接口。 URI GET /v2.1/{project_id}/os-keypairs 参数说明请参见表1。表1 参数说明

 帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 密钥、密码管理（OpenStack Nova API）
Linux实例执行命令或启动服务时出现错误：Cannot allocate memory - 弹性云服务器 ECS

memory 可能原因出现该错误信息表示系统的进程ID（PID），即系统中运行的进程/线程数达到了最大限制，该限制由内核参数/proc/sys/kernel/pid_max控制。解决方案远程登录ECS实例。执行以下命令，查看系统当前已运行的进程数。 ps -eLf | wc -l

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
NetworkManager在运行docker容器时占用大量内存怎么办？ - 弹性云服务器 ECS

在运行多个docker容器的环境下NetworkManager服务占用内存很大，导致内存使用率过高。本节操作适用于CentOS 7、Ubuntu 16.04操作系统。该文档涉及重启网络服务，可能会造成业务中断，请谨慎操作。问题分析 NetworkManager消耗的内存量随着容器启动

 帮助中心 > 弹性云服务器 ECS > 故障排除 > 网络配置
删除安全组规则（废弃） - 弹性云服务器 ECS

删除安全组规则（废弃）功能介绍删除安全组规则。当前API已废弃，请使用“删除安全组规则”。 URI DELETE /v2.1/{project_id}/os-security-group-rules/{security_group_rule_id} 参数说明请参见表1。表1

帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 安全组管理（OpenStack Nova API）
查询API版本信息列表（废弃） - 弹性云服务器 ECS

string API版本的状态。 CURRENT，这是使用的API的首选版本 SUPPORTED，这是一个较老的，但仍然支持的API版本。 DEPRECATED，一个被废弃的API版本，该版本将被删除。 version string 如果API的这个版本支持微版本，则支持最大的微版本。如果不支持微版本，这将是空字符串。

帮助中心 > 弹性云服务器 ECS > API参考 > 历史API > 查询API版本信息（OpenStack Nova API）
Windows 2012系统卸载某些软件后无法进入系统桌面怎么办？ - 弹性云服务器 ECS

恢复过程就是由核心模式切换到完整模式的过程，步骤如下：登录弹性云服务器。单击右上角的“Send CtrlAltDel”按钮，打开任务管理器。选择“文件 > 运行新任务”。系统打开“新建任务”窗口。图1 新建任务在“打开”栏，输入“cmd”，然后按回车键。在弹出的命令行窗口执行以下命令，将系统由核心模式切换到完整模式。

帮助中心 > 弹性云服务器 ECS > 常见问题 > 远程登录 > 远程连接类
Linux镜像安装一键式重置密码插件启动失败怎么办？ - 弹性云服务器 ECS

at step EXEC spawning /CloudrResetPwdAgent/bin/./cloudResetPwdAgent.script: Permission denied systemd[1]: cloudResetPwdAgent.service: Control process

帮助中心 > 弹性云服务器 ECS > 常见问题 > 密码与密钥对
一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办？ - 弹性云服务器 ECS

一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办？问题描述在弹性云服务器运行时，一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高。图1 查看虚拟内存占用情况问题根因应用程序使用内存的时候通过glibc的内存池来提供，glibc 2.10之前的版本中，只有一个内存池，称为main arena。从glibc

帮助中心 > 弹性云服务器 ECS > 常见问题 > 密码与密钥对
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 - 弹性云服务器 ECS

解决方案远程登录ECS实例。执行以下命令，查看ECS实例内核参数kernel.unknown_nmi_panic的值。 sysctl -n kernel.unknown_nmi_panic 如果内核参数的取值为1，说明是由于内核参数配置错误引起的ECS实例异常重启。图1 排查结果

 帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因总线脱落。内核版本不一致。问题影响显卡驱动安装失败，显卡无法使用。处理方法执行以下命令，查看内核版本，检查内核版本是否一致。 rpm -qa | grep

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错问题原因 XID 说明 32 Invalid or corrupted push buffer stream，推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID，表明GPU硬件故障需要下线维修。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

件，安装过程出错问题问题描述用户使用不带驱动的公共镜像或私有镜像，自行安装NVIDIA驱动软件包、CUDA软件包，在安装过程中脚本执行报错。判断方式确认用户使用的镜像文件。确认用户的NVIDIA软件包来源。确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 非硬件故障自恢复处理方法
如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

可能是因为显卡过热，用户先停止业务，待显卡缓解过热后再执行nvidia-smi命令，查看ERR!是否消失。如果回显正常，建议用户调整下业务，限制显卡运行的最大功率。如果仍未恢复正常，根据故障信息收集收集故障信息后联系技术支持处理。父主题：显卡故障诊断及处理方法

 帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

问题原因某种健全性检查没有通过，GPU驱动程序不会使用或信任其内容（某些内容未被使用）。问题影响可能影响ECC相关非易失数据的记录，从而导致本该隔离的GPU内存页面继续使用。处理方法用户停止业务并执行业务迁移。执行业务迁移后，根据故障信息收集收集故障信息后联系技术支持处理。

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

问题影响可能影响一个或多个GPU的相关应用程序。处理方法执行nvidia-smi命令，查看显卡信息。如果在volatile Uncorr. ECC下ecc error > 0，执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。如果在volatile

帮助中心 > 弹性云服务器 ECS > 故障排除 > GPU实例故障自诊断 > 显卡故障诊断及处理方法
NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错：Failed to restart

帮助中心 > 弹性云服务器 ECS > 故障排除 > 操作系统类（Linux）

总条数： 1198

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何处理用户安装了GRID驱动，但未购买、配置License问题 - 弹性云服务器 ECS

Web访问超时系统日志打印：nf_conntrack:table full, dropping packet - 弹性云服务器 ECS

查询SSH密钥列表（废弃） - 弹性云服务器 ECS

Linux实例执行命令或启动服务时出现错误：Cannot allocate memory - 弹性云服务器 ECS

NetworkManager在运行docker容器时占用大量内存怎么办？ - 弹性云服务器 ECS

删除安全组规则（废弃） - 弹性云服务器 ECS

查询API版本信息列表（废弃） - 弹性云服务器 ECS

Windows 2012系统卸载某些软件后无法进入系统桌面怎么办？ - 弹性云服务器 ECS

Linux镜像安装一键式重置密码插件启动失败怎么办？ - 弹性云服务器 ECS

一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办？ - 弹性云服务器 ECS

内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 - 弹性云服务器 ECS

如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS

如何处理GPU虚拟机故障，在message日志中发现存在Xid报错 - 弹性云服务器 ECS

如何处理用户自行安装NVIDIA驱动、CUDA软件，安装过程出错问题 - 弹性云服务器 ECS

如何处理GPU散热异常，执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS

如何处理GPU掉卡，执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS

如何处理ECC ERROR：执行nvidia-smi -q存在double bit ecc error错误，并无待隔离页 - 弹性云服务器 ECS

NetworkManager服务无法启动，报错：Failed to restart NetworkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线