检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询API版本信息列表(废弃) 功能介绍 返回Nova当前所有可用的版本。 为了支持功能不断扩展,Nova API支持版本号区分。Nova中有两种形式的版本号: "主版本号": 具有独立的url。 "微版本号": 通过Http请求头X-OpenStack-Nova-API-Version
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
Tesla驱动及CUDA工具包获取方式 操作场景 使用GPU加速型云服务器时,需确保已安装Tesla驱动和CUDA工具包,否则无法实现计算加速功能。本节内容提供Tesla驱动及CUDA工具包下载地址,请根据实例的类型,选择具体的驱动版本。
在打开的控制台首页,选择“计算 > 弹性云服务器 ECS”。 选择待登录的云服务器,登录弹性云服务器。 Windows弹性云服务器提供“VNC远程登录方式”和“MSTSC方式”两种登录方式。具体操作请参见如何登录弹性云服务器?。
pip安装软件时出现错误:command ´gcc´ failed with exit status 1 问题描述 安装Python库软件时,需配置pip源。以中国科技大学镜像源为例: [root@test home]# cat /root/.pip/pip.conf [global
Web访问超时系统日志打印:nf_conntrack:table full, dropping packet 问题现象 客户端访问web时出现time out。 服务端系统日志/var/log/messages打印kernel: nf_conntrack:table full, dropping
图3 安装驱动 图4 同意NVIDIA软件许可协议 图5 选择安装选项 驱动安装完成后,可能需要重启云服务器。 如果需要重启,单击“稍后重启”,待脚本执行完成后,手动重启云服务器。 图6 稍后重启 如果不需要重启,单击“关闭”。
查询浮动IP资源池列表(废弃) 功能介绍 查询浮动IP资源池列表。 当前API已废弃,请使用"查询网络"。 接口约束 接口参数为:router:external=True GET /networks?router:external=True 返回结果中的name字段 URI GET
以root账号远程登录云服务器。 执行以下命令,获取驱动安装脚本并运行。
通过元数据获取ECS基本信息 操作场景 弹性云服务器元数据包含了弹性云服务器在云平台的基本信息,例如云服务ID、主机名、网络信息等。弹性云服务器元数据支持两种风格,可以分别通过兼容Openstack和兼容EC2的API获取,如表1所示。
Linux镜像安装一键式重置密码插件启动失败怎么办? 操作场景 Linux镜像安装一键式重置密码插件启动失败,请参考本章节处理。 问题描述 用户通过执行命令sudo sh setup.sh安装一键式重置密码插件,有如下报错: begin install CloudResetPwdAgent
如何处理可恢复的Xid故障问题 问题原因 Xid 说明 13 Graphics Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing
关于Linux云服务器的实例自定义数据脚本 Linux弹性云服务器的自定义实例自定义数据脚本(简称“脚本”)采用开源的Cloud-init架构实现,该架构以云服务器的元数据为数据来源,对弹性云服务器进行各项自动化配置。
执行以下命令,查询当前弹性云服务器的分区情况。
如果表1中不包含您的弹性云服务器所在区域,请您为弹性云服务器绑定EIP,然后选择就近区域进行下载。 绑定EIP的详细操作,请参见绑定弹性公网IP。
确认弹性云服务器是否有多网卡配置。如果配置多网卡且弹性公网IP绑定在非主网卡上,请在弹性云服务内部配置策略路由。 具体请参见如何配置多网卡弹性云服务器的策略路由?。 登录弹性云服务器,执行以下命令,查看网卡是否创建且网卡获取私有IP地址。
内核参数kernel.unknown_nmi_panic配置错误导致Linux ECS实例异常重启 问题描述 Linux操作系统的ECS实例发生异常重启事件,错误提示如下: Kernel panic - not syncing: NMI: Not continuing 同时,内核日志打印如下信息
如何处理升级内核后,驱动不可用问题 问题描述 客户执行nvidia-smi,报错failded to initialize NVML: Driver/library version mismatch。 客户执行nvidia-smi,报错NVIDIA-SMI has failed because
通过AOM批量更新ECS一键式重置密码插件 弹性云服务器提供一键式重置密码功能。当弹性云服务器的密码丢失或过期时,如果提前安装了一键式重置密码插件,则可以应用一键式重置密码功能,给弹性云服务器设置新密码。
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr