检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
工作。 检查过程中,如果发现您的弹性云服务器未安装ibstat等命令工具,需先从InfiniBand网卡驱动安装包中获取该工具并进行安装。 检查IB云服务器的网卡状态是否正常。 登录弹性云服务器。 执行以下命令,查看IB云服务器的网卡状态是否正常。 ibstat 是,执行2。 否,请联系客服寻求技术支持。
如何查询显卡在位信息 查询显卡在位信息方法如下: 登录弹性云服务器。 执行以下命令,查看显卡在位情况,确认是否和服务器规格显卡数一致,保存回显结果。 lspci | grep NV 如下图所示,可以看到有一张GPU显卡,且显卡是rev a1,状态正常;如果为rev ff或其他状态,则显卡可能故障。
可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile Uncorr. ECC下ecc error > 0,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。 如果在volatile Uncorr. ECC下ecc
-pm 1 执行以下命令,打开并编辑“/etc/rc.local”文件。 vim /etc/rc.local 配置开机自启动,将命令“nvidia-smi -pm 1”写入“/etc/rc.local”文件中。 按“Esc”,输入:wq保存并退出。 执行以下命令,添加启动权限。 chmod
nvidia.com/deploy/xid-errors/index.html。 处理方法 执行dmesg | grep –i xid命令,查看是否存在xid报错。 通知用户停止业务,执行业务迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
如何查询XID报错信息 XID消息是NVIDIA驱动程序向操作系统的内核日志或事件日志打印的错误报告,用于标识GPU错误事件,提供GPU硬件、NVIDIA软件或您应用程序中的错误类型、错误位置、错误代码等信息。 查询XID报错信息方法如下: 登录弹性云服务器。 执行以下命令,查看是否存在xid相关报错,保存回显结果。
可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc error,执行nvidia-smi -q -i &.{gpu_id}查看卡的详细信息。 如果在volatile Uncorr. ECC下未发现ecc
执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep gcc #查看gcc版本 rpm -qa | grep kernel-devel #查看kernel-devel版本 如果内核版本不一致,请重装驱动。 如果内核版本一致,则执行下一步。 查看dmesg日志,检查是否存在NVRM报错。
将规格变更为KVM实例。 系统支持将“XEN实例”变更为“KVM实例”,不支持将“KVM实例”变更为“XEN实例”。 操作流程 XEN实例变更为KVM实例的操作流程如图1所示。 图1 Linux云服务器变更流程(自动配置) 具体的变更操作如表1所示。 表1 XEN实例变更为KVM实例(自动配置)
修改弹性云服务器挂载的单个磁盘信息 功能介绍 修改云服务器挂载的单个磁盘信息。 当前仅支持修改delete_on_termination字段。 接口约束 不支持修改包年/包月计费模式的磁盘。 不支持修改共享盘。 不支持修改系统盘。 调试 您可以在API Explorer中调试该接口。
查询弹性云服务器关联的弹性公网IP 场景描述 本章节指导用户通过弹性云服务器和弹性公网IP接口,查询弹性云服务器关联的弹性公网IP详情。 涉及接口 本示例场景涉及如下接口调用: 查询弹性云服务器详情 根据公网IP查询公网IP详情 操作步骤 查询弹性云服务器详情 接口相关信息 URI格式:
统会自动回退,同时在界面上直观的展示错误码,例如“(Ecs.0013)EIP配额不足”。 操作失败 变更规格 用户申请变更规格后,如果规格变更失败,则“失败信息”栏将显示本次变更规格操作。 操作步骤 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 单击“”,选择“计算
TP协议。 执行以下命令,查看/etc/ssh/sshd_config文件。 vi /etc/ssh/sshd_config 查看关于SFTP的配置描述,说明SFTP关联的配置文件是/usr/libexec/openssh/sftp-server 图2 查看SFTP关联的配置文件
添加新硬盘修改/etc/fstab以将新硬盘安装到旧挂载点,然后umount旧磁盘,执行mount -a后使用df查看没有挂载成功。 本节操作适用于CentOS、EulerOS操作系统。 根因分析 执行以下命令,查询有问题的mount unit。 systemctl list-units --type=mount
云服务器切换虚拟私有云 功能介绍 云服务器切换虚拟私有云。 本接口为异步接口,当前云服务器切换虚拟私有云请求下发成功后会返回job_id,此时云服务器切换虚拟私有云并没有立即完成,需要通过调用查询任务的执行状态查询job状态,当Job状态为 SUCCESS 时代表云服务器虚拟私有云切换成功。
变更云服务器规格 功能介绍 变更云服务器规格。 本接口为异步接口,当前变更弹性云服务器规格请求下发成功后会返回job_id,此时变更弹性云服务器规格并没有立即完成,需要通过调用查询任务的执行状态查询job状态,当Job状态为 SUCCESS 时代表云服务器规格变更成功。 V1.1
超过目标容量或目标容量减少时的实例中断行为。 terminate:释放 noTermination:不释放 instances_behavior_with_expiration String 请求到期时正在运行实例的中断行为。 terminate:释放 noTermination:不释放 valid_since
在任意路径下执行nvidia-smi命令。(CCE集群场景为/opt/cloud/cce/nvidia/bin目录下) Windows操作系统获取显卡ID的方法如下: 进入到C:\Program Files\NVIDIA Corporation\NVSMI路径。 执行nvidia-smi命令。 父主题:
在临时云服务器上执行以下命令,将这个正常系统的/目录下所有文件的权限都备份保存在 systemp.bak 中。 getfacl -R / >systemp.bak 使用scp命令将正常的备份文件传至故障云服务器中。 您可以在临时云服务器上执行以下命令,上传systemp.bak文件到故障云服务器。
查询云服务器详情列表 功能介绍 根据用户请求条件筛选、查询所有的弹性云服务器,并关联获取弹性云服务器的详细信息。 该接口支持查询弹性云服务器计费方式,以及是否被冻结。 接口约束 当前云服务器详情列表中未包含包年/包月云服务器到期时间,如需获取,可以通过客户运营能力相关接口进行查询