检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理云服务器组 操作场景 云服务器组是对云服务器的一种逻辑划分,云服务器组中的弹性云服务器遵从同一策略。 当前云服务器组支持以下策略: 反亲和性:同一云服务器组中的弹性云服务器分散地创建在不同的主机上,提高业务的可靠性。 使用反亲和性策略可以将业务涉及到的云服务器分散部署在不同的物
GPU实例故障自诊断 GPU实例故障,如果已安装GPU监控的CES Agent,当GPU服务器出现异常时则会产生事件通知,可以及时发现问题避免造成用户损失。如果没有安装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表
使用创建时的用户名和密码无法SSH方式登录GPU加速云服务器 处理方法 先使用VNC方式远程登录弹性云服务器,并修改配置文件,然后再使用SSH方式登录。 进入弹性云服务器运行页面,单击“远程登录”。 自动跳转至登录页面,登录root用户,输入密码。 密码为创建弹性云服务器时设置的密码。
选择要登录的云服务器,单击操作列中的“远程登录”。 在弹出的“登录Linux云服务器”窗口中,单击“CloudShell登录”。 在CloudShell界面配置云服务器信息。 首次登录,默认会打开CloudShell配置向导,输入云服务器的相关参数进行连接。 您可以选择使用弹性公网IP或私有IP登录云服务器。
当前已支持使用自动化脚本安装GPU驱动,建议优先使用自动安装方式,脚本获取以及安装指导请参考(推荐)自动安装GPU加速型ECS的GPU驱动(Linux)和(推荐)自动安装GPU加速型ECS的GPU驱动(Windows)。 GPU虚拟化型实例,需要严格按照表1选择合适的驱动版本下载使用。 Tesla驱动下载地址
方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis nvidia 图2 查询安装的驱动版本 根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是为
添加云服务器组成员 功能介绍 将云服务器加入云服务器组。添加成功后,该云服务器与云服务器组中的其他成员尽量分散地创建在不同主机上。 接口约束 仅支持添加虚拟化类型为KVM的弹性云服务器。 当前只支持反亲和性策略,即同一云服务器组中的弹性云服务器分散地创建在不同的主机上,提高业务的可靠性。
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
了解 了解华为云弹性云服务器的应用场景和实例详情,有助于您更准确地匹配实际业务,更快速地选择所需实例,让您的业务高效上云。 产品介绍 什么是弹性云服务器 弹性云服务器使用场景 弹性云服务器使用须知 实例规格清单 ECS最新动态 ECS功能总览 03 入门 创建ECS实例后,您可以通
GPU加速云服务器出现NVIDIA内核崩溃,如何解决? 问题描述 GPU加速型云服务器在运行过程中发生crash,重启云服务器后检查日志,发现没有打印NVIDIA驱动堆栈日志。 图1 堆栈日志信息 可能原因 云服务器在运行过程中遇到NVIDIA官方驱动bug,导致云服务器内核崩溃。
单个资源退订与批量退订可使用不同的操作方式: 退订单个资源:单击待退订资源所在行的“退订资源”。 批量退订:在退订列表中勾选需要退订的资源,单击列表左上角的“退订资源”。 查看退订信息,勾选“我已确认本次退订金额和相关费用”后,单击“退订”。 父主题: ECS删除与退订
如何获取显卡ID 如何查询显卡详细信息 如何查询显卡在位信息 如何查询NVIDIA的错误信息 如何查询XID报错信息 如何收集NVIDIA日志 如何查询内核信息 如何收集驱动安装信息 父主题: GPU实例故障自诊断
在macOS系统上登录Windows云服务器: 登录用户名为“Administrator”,且弹性云服务器必须绑定弹性公网IP。 具体操作,请参见macOS系统登录Windows弹性云服务器。 登录Linux弹性云服务器 弹性云服务器设置的登录鉴权方式不同,登录弹性云服务器的方法也存在差异,如图2所示。
华为云有没有提供NTP服务器,怎样配置? 有,该NTP服务器仅限于在华为云控制台上购买的弹性云服务器配置使用。 如需在购买的弹性云服务器上配置NTP服务器,您可以选择使用华为云控制台自己提供的NTP服务器,也可以选择其他NTP服务器。配置NTP服务器的操作相同,本节以华为云控制台提供的NTP服
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
NAT网关能够为VPC内的弹性云服务器提供SNAT和DNAT功能,通过灵活简易的配置,即可轻松构建VPC的公网出入口,实现多个弹性云服务器共享弹性公网IP访问Internet或使弹性云服务器对互联网提供服务。 通过Linux操作系统的代理主机 如果您已拥有一台绑定了EIP的弹性云服务器,可将该弹
如何收集NVIDIA日志 收集NVIDIA日志方法如下: 登录弹性云服务器。 在任意目录下执行以下命令。(如果是CCE场景,进入到/opt/cloud/cce/nvidia/bin目录后执行) sh nvidia-bug-report.sh 或 ./nvidia-bug-report
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 如何处理用户使用场景与其选择的驱动、镜像不配套问题 如何处理用户安装了GRID驱动,但未购买、配置License问题 父主题: GPU实例故障自诊断
购买ECS ECS购买方式导航 自定义购买ECS 购买竞价计费型ECS 购买竞享计费型ECS 通过私有镜像购买ECS 通过智能购买助手购买ECS 通过规格选型引导购买ECS 通过共享VPC购买ECS 相同配置ECS 父主题: 实例
Windows云服务器登录方式一览 云服务器操作系统 本地主机操作系统 连接方法 条件 Windows Windows (推荐使用)使用控制台提供的RDP文件登录云服务器。 使用RDP文件登录Windows云服务器。 云服务器绑定弹性公网IP。 (通过内网登录云服务器时可以不绑定弹性公网I