-
查询安全组详细信息(废弃) - 弹性云服务器 ECS
查询安全组详细信息(废弃) 功能介绍 查询安全组详细信息。 该接口只能查询入方向安全组规则,如需查询出方向的安全组规则,请参见《虚拟私有云接口参考》的”安全组(原生OpenStack接口)> 查询安全组详情“章节。 当前API已废弃,请使用“查询安全组详情”。 URI GET /v2
-
Web访问超时系统日志打印:nf - 弹性云服务器 ECS
Web访问超时系统日志打印:nf_conntrack:table full, dropping packet 问题现象 客户端访问web时出现time out。 服务端系统日志/var/log/messages打印kernel: nf_conntrack:table full, dropping packet。
-
执行磁盘初始化脚本后,Oralce、MySQL和SQL Server等数据库系统日志出现Msg 823错误怎么办? - 弹性云服务器 ECS
处理方法 登录弹性云服务器,打开运行对话框,输入“services.msc”并按回车键,查看Windows系统的服务。 查找virtual disk服务,并确保virtual disk服务停止状态。 图1 查看virtual disk服务状态 如果virtual disk服务的状态是
-
如何处理升级内核后,驱动不可用问题 - 弹性云服务器 ECS
-r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find /lib/modules -name nvidia.ko 如果当前内核版本与安装驱动时的内核版本不
-
针对Intel处理器芯片存在的Meltdown和Spectre安全漏洞,应该如何规避? - 弹性云服务器 ECS
针对Intel处理器芯片存在的Meltdown和Spectre安全漏洞,应该如何规避? 问题描述 北京时间1月3日,Intel处理器芯片被曝出存在严重的Meltdown和Spectre安全漏洞,漏洞详情如下: 漏洞名称:Intel处理器存在严重芯片级漏洞 漏洞编号:CVE-201
-
如何处理ECC ERROR:存在待隔离页问题 - 弹性云服务器 ECS
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr
-
如何处理可恢复的Xid故障问题 - 弹性云服务器 ECS
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing,
-
重装/切换操作系统/变更规格对磁盘数据有影响吗? - 弹性云服务器 ECS
变更规格 功能简介 还原服务器的初始化状态。 重装前后操作系统不发生改变。 将现有的操作系统切换为不同镜像类型的操作系统。 中国大陆外区域(包括中国港澳台及其他国家、地区)不支持Windows镜像和Linux镜像之间的切换。 更多约束限制请参考切换操作系统。 云服务器规格无法满足业务需
-
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 - 弹性云服务器 ECS
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
-
通过puttygen.exe工具创建的密钥对,导入管理控制台失败怎么办? - 弹性云服务器 ECS
复制红框中的公钥内容,并将其粘贴在文本文档中,以.txt格式保存在本地,保存公钥文件。 将公钥文件导入管理控制台。 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 选择“计算 > 弹性云服务器”。 在左侧导航树中,选择“密钥对”。 在“密钥对”页面,单击“导入密钥对”。 将“.txt”格
-
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” - 弹性云服务器 ECS
如何处理驱动安装报错“Unable to load the kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep
-
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 - 弹性云服务器 ECS
DA软件版本。 处理方法 推荐客户使用自动安装驱动脚本。根据当前华为云驱动自动安装脚本中提供的CUDA版本,按需安装。 GPU加速型实例自动安装GPU驱动(Linux) GPU加速型实例自动安装GPU驱动(Windows) 如果自动安装驱动脚本中无用户需要的目标软件版本,请联系技术支持处理。
-
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? - 弹性云服务器 ECS
一个应用软件是否可以将应用软件中不同的部件分散部署到不同的区域? 可以,但是不建议这种部署方式。 建议将一个应用软件内的不同部件部署到同一个区域,这样不同部件之间的通信可以采用内网网络通信,既可以节省因采用公网网络通信带来的带宽费用,又可以保证不同部件之间的网络通信质量。 父主题:
-
Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error - 弹性云服务器 ECS
Linux操作系统执行passwd命令重置密码失败提示:Authentication token manipulation error 问题现象 root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation
-
如何处理用户使用场景与其选择的驱动、镜像不配套问题 - 弹性云服务器 ECS
如果用户未安装驱动,请自行安装驱动,或切换带驱动的公共镜像,或使用驱动自动安装脚本安装驱动: GPU加速型实例自动安装GPU驱动(Linux) GPU加速型实例自动安装GPU驱动(Windows) 如果用户已安装驱动,但驱动不匹配使用场景,请卸载驱动后重新安装。请参考安装GPU驱动。
-
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 - 弹性云服务器 ECS
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
-
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 - 弹性云服务器 ECS
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
-
NetworkManager服务无法启动,报错:Failed to restart NetuorkManager.service: Unit NetworkManager.service is masked - 弹性云服务器 ECS
service: Unit NetworkManager.service is masked。 可能原因 服务单元被禁用,导致NetworkManager服务无法启动。 处理方法 执行以下命令,解除服务单元mask状态。 systemctl unmask NetworkManager 父主题:
-
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) - 弹性云服务器 ECS
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
-
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff - 弹性云服务器 ECS
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。