检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Tesla驱动及CUDA工具包获取方式 操作场景 使用GPU加速型云服务器时,需确保已安装Tesla驱动和CUDA工具包,否则无法实现计算加速功能。本节内容提供Tesla驱动及CUDA工具包下载地址,请根据实例的类型,选择具体的驱动版本。 Tesla驱动及CUDA工具包安装操作指
auto_install.sh 根据界面提示,选择需要安装的驱动版本。 图1 选择驱动安装版本 卸载已安装驱动。 如果云服务器已安装过驱动,请根据提示先执行驱动卸载操作。 如果云服务器本身未安装驱动,脚本会自动跳过该步骤,开始进行驱动安装。 卸载CUDA Toolkit。 图2 卸载CUDA
查询浮动IP资源池列表(废弃) 功能介绍 查询浮动IP资源池列表。 当前API已废弃,请使用"查询网络"。 接口约束 接口参数为:router:external=True GET /networks?router:external=True 返回结果中的name字段 URI GET
abc /add 弹性云服务器创建成功后,您可以使用新创建的用户名和密码登录弹性云服务器。 案例5 该样例介绍如何通过实例自定义数据注入,为Linux弹性云服务器更新系统软件包,并且开启httpd相关服务。注入成功后,您的弹性云服务器就可以使用httpd服务了。 实例自定义数据注入示例:
该漏洞不会引起不同弹性云服务器之间的攻击,但可能会引起如下问题: 弹性云服务器内多个应用之间,可能存在攻击。 对于同一弹性云服务器,多个账号之间可能存在攻击。 使用公共镜像的弹性云服务器,云平台会对公共镜像依次修复,不会对您的业务带来影响。 使用私有镜像的弹性云服务器,请根据漏洞影响评
img.bak dracut -v /boot/initramfs-$(uname -r).img $(uname -r) 执行以下命令,重启云服务器。 reboot 父主题: 非硬件故障自恢复处理方法
如何处理显卡ERR!问题 问题描述 执行nvidia-smi命令,仅Pwr:Usage/Cap(能耗)显示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。
communicate with the NVIDIA diver。 判断方式 执行以下命令,查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find
pip安装软件时出现错误:command ´gcc´ failed with exit status 1 问题描述 安装Python库软件时,需配置pip源。以中国科技大学镜像源为例: [root@test home]# cat /root/.pip/pip.conf [global]
通过AOM批量更新ECS一键式重置密码插件 弹性云服务器提供一键式重置密码功能。当弹性云服务器的密码丢失或过期时,如果提前安装了一键式重置密码插件,则可以应用一键式重置密码功能,给弹性云服务器设置新密码。 应用运维管理(Application Operations Managem
图3 安装驱动 图4 同意NVIDIA软件许可协议 图5 选择安装选项 驱动安装完成后,可能需要重启云服务器。 如果需要重启,单击“稍后重启”,待脚本执行完成后,手动重启云服务器。 图6 稍后重启 如果不需要重启,单击“关闭”。 图7 关闭 返回桌面,在空白处右键单击,选择“NV
SP4镜像创建的弹性云服务器,内存需要大于等于4GiB时才能支持一键式重置密码功能。 弹性云服务器使用的VPC网络DHCP不能禁用。 弹性云服务器网络正常通行。 设置弹性云服务器的网卡属性为DHCP,使弹性云服务器可以动态获取IP地址。 Linux弹性云服务器的设置方法,请参见设置网卡属性为DHCP(Linux)。
SP4镜像创建的弹性云服务器,内存需要大于等于4GiB时才能支持一键式重置密码功能。 弹性云服务器使用的VPC网络DHCP不能禁用。 弹性云服务器网络正常通行。 设置弹性云服务器的网卡属性为DHCP,使弹性云服务器可以动态获取IP地址。 Linux弹性云服务器的设置方法,请参见设置网卡属性为DHCP(Linux)。
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing,
Linux镜像安装一键式重置密码插件启动失败怎么办? 操作场景 Linux镜像安装一键式重置密码插件启动失败,请参考本章节处理。 问题描述 用户通过执行命令sudo sh setup.sh安装一键式重置密码插件,有如下报错: begin install CloudResetPwdAgent
一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高怎么办? 问题描述 在弹性云服务器运行时,一键式重置密码插件占用虚拟内存VIRT和常驻内存SHR过高。 图1 查看虚拟内存占用情况 问题根因 应用程序使用内存的时候通过glibc的内存池来提供,glibc 2.10之前的版本中,只有一个内存池,称为main
PAGE_RETIREMENT 如果Pending Page Blacklist 为No,说明当前已无待隔离页。 方法二: 执行以下命令,重启服务器。 reboot 执行以下命令,查看是否存在待隔离页。 nvidia-smi -q -d PAGE_RETIREMENT 如果Pending
导配置License。 如果用户已购买过License,但是未配置License,请参考GPU加速型实例安装GRID驱动配置License服务器与License文件。 父主题: 非硬件故障自恢复处理方法
Windows) 操作场景 当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。 执行机应该与待更新机器在同一VPC下。
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 问题描述 Linux操作系统的ECS实例发生异常重启事件,错误提示如下: Kernel panic - not syncing: NMI: Not continuing 同时,内核日志打印如下信息: