检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
ECS删除与退订 “删除”按钮是什么意思? 已删除的弹性云服务器可以再开通吗? 已删除的弹性云服务器还可以恢复数据吗? 如何删除、重启弹性云服务器? 重启/关机弹性云服务器时,长时间处于“正在重启”/“正在关机”状态,怎么办? 如何退订我的弹性云服务器?
权限和授权项 权限及授权项说明 生命周期管理 状态管理 批量操作 网络管理 镜像管理 安全组管理 规格查询 网卡管理 磁盘管理 元数据管理 租户配额管理 SSH密钥管理 密码管理 浮动IP管理 云服务器组管理 云服务器控制台管理 可用区管理 标签管理 FPGA逻辑文件管理 资源粒度授权
重启/关机弹性云服务器时,如果弹性云服务器长时间处于“正在重启”/“正在关机”状态,可以执行强制重启/强制关机操作。强制重启/强制关机操作会导致弹性云服务器中未保存的数据丢失,请谨慎操作。 对于裸金属类型的规格实例(规格名称中包含physical),请勿通过操作系统的shutdown,poweoff,hal
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
Run下,新建一个注册表文件ctfmon.exe。 图1 Run目录 修改字符串的数值数据为ctfmon.exe的存储位置:C:\Windows\System32\ctfmon.exe 图2 修改字符串的数值数据 在运行窗口输入“msconfig”,打开“系统配置使用程序”。 选择“启动”
标记为启动云服务器操作,详情请参见表3。 表3 os-start字段数据结构说明 参数 是否必选 参数类型 描述 servers 是 Array of objects 云服务器ID列表,详情请参见表4。 表4 servers字段数据结构说明 参数 是否必选 参数类型 描述 id 是 String
reboot字段数据结构说明 参数 是否必选 参数类型 描述 type 是 String 重启类型: SOFT:普通重启。 HARD:强制重启。 servers 是 Array of objects 云服务器ID列表,详情请参见表4。 表4 servers字段数据结构说明 参数 是否必选
interfaceAttachment Object 云服务器网卡信息列表,详情请参见表3。 表3 interfaceAttachment字段数据结构说明 参数 参数类型 描述 port_state String 网卡端口状态。 fixed_ips Array of objects 网卡IP信息列表,详情请参见表4。
基于弹性云服务器安装及部署Jenkins 如何使用auditd记录Linux系统文件改动 通过Extundelete恢复弹性云服务器误删除数据(Linux) 搭建ThinkPHP框架 使用Packer创建私有镜像
Server 2016 标准版 64位 Windows Server 2016 数据中心版 64位 Windows Server 2019 标准版 64位 Windows Server 2019 数据中心版 64位 支持的规格:G6v、G6、P2s、P2v、P2vs、Pi2、Pi1、P1。
Run下,新建一个注册表文件ctfmon.exe。 图1 Run目录 修改字符串的数值数据为ctfmon.exe的存储位置:C:\Windows\System32\ctfmon.exe 图2 修改字符串的数值数据 在运行窗口输入“msconfig”,打开“系统配置使用程序”。 选择“启动”
请求参数 参数 是否必选 参数类型 描述 os-stop 是 Object 标记为关闭云服务器操作,详情请参见表3。 表3 os-stop字段数据结构说明 参数 是否必选 参数类型 描述 servers 是 Array of objects 云服务器ID列表,详情请参见表4。 type
NetworkManager服务无法启动,报错:Failed to restart NetworkManager.service: Unit NetworkManager.service is masked 问题描述 NetworkManager启动时报错:Failed to restart
照版本配套关系。 版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。 若显示适配器恢复正常,则恢复完成。 若仍异常,则执行下一步。 请尝试重装GPU驱动或升级驱动版本。请参考安装GPU驱动。 如果用户使
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
5操作系统云服务器执行驱动安装脚本失败怎么办? Linux云服务器变更规格时执行驱动安装脚本失败怎么办? Windows弹性云服务器变更规格后数据盘脱机怎么办? Linux弹性云服务器变更规格后磁盘脱机怎么办? 为什么Windows 2016操作系统的云服务器规格变更后出现蓝屏? K
区域与可用区 什么是可用区,怎样选择和查看可用区? 如何选择区域? 区域之间是否存在产品差异? 如何获取弹性云服务器的物理机房位置? 可用区之间的数据传输是否需要收费? 云服务器购买成功后,是否可以更换区域和可用区? 弹性云服务器可以迁移到其他区域/可用区/账号吗? 不同区域之间的云服务器可以使用负载均衡吗?
IB)功能,需在安装InfiniBand网卡驱动后,给IB网卡手动配置一个IP地址。 删除H2型云服务器后,SSD磁盘中的数据会被自动清除。因此,在使用H2型云服务器的过程中,请勿将持久性数据保存至SSD磁盘。 对于H2型云服务器,关机后仍然计费。如果停止计费,需删除弹性云服务器。 父主题: 实例规格(x86)