检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 fpga_image_id 是 FPGA镜像的ID。 请求消息 无 响应消息 无 请求示例 DELETE https://{endpoint}/v1/{project_id}/cloud
可能是因为显卡过热,用户先停止业务,待显卡缓解过热后再执行nvidia-smi命令,查看ERR!是否消失。 如果回显正常,建议用户调整下业务,限制显卡运行的最大功率。 如果仍未恢复正常,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
选择“网络适配器”,右键单击“Red Hat VirtIO Ethernet Adapter #2”,选择“卸载(U)”。 单击“确定”。 注意:不勾选“删除此设备的驱动程序软件”。 右键单击下图所示位置,单击“扫描检测硬件改动(A)”。 完成扫描检查后,即可修改DNS,详细操作请参见如何为ECS配置DNS?。
ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 如何处
__type_baremetal 表示该server是一个裸金属服务器。 __type_virtual 表示该server是一个云服务器。 请求示例 创建指定云服务器的标签。 PUT https://{endpoint}/v2.1/{project_id}/servers/{server_id}/tags
delete_on_termination Boolean 卸载网卡时,是否删除网卡。 true: 删除; false: 不删除 driver_mode String 网卡的驱动类型,预留字段,默认取值为virtio。 min_rate Integer 网卡带宽下限。 multiqueue_num Integer
请求参数 参数 是否必选 参数类型 描述 os-start 是 null 标记为启动云服务器操作,数据结构为空。 响应消息 无 请求示例 启动指定的云服务器。 POST https://{endpoint}/v2.1/{project_id}/servers/{server_id}/action
信息分类 相关文档 显卡基本信息 如何获取显卡ID 如何查询显卡详细信息 如何查询显卡在位信息 显卡故障信息(Linux) 如何查询NVIDIA的错误信息 如何查询XID报错信息 NVIDIA日志收集(Linux) 如何收集NVIDIA日志 镜像内核信息收集(Linux) 如何查询内核信息
是否必选 参数类型 描述 type 是 String 重启类型: SOFT:普通重启。 HARD:强制重启。 响应消息 无 请求示例 重启指定的云服务器。 POST https://{endpoint}/v2.1/{project_id}/servers/{server_id}/action
描述 type 否 String 关机类型,默认为SOFT: SOFT:普通关机。 HARD:强制关机。 响应消息 无 请求示例 关闭指定的云服务器。 POST https://{endpoint}/v2.1/{project_id}/servers/{server_id}/action
按“Esc”,输入:wq保存并退出。 执行以下命令,添加启动权限。 chmod +x /etc/rc.d/rc.local 否,请执行下一步。 查看实例的Tesla驱动版本是否为510.xx.xx。 是,该驱动版本与镜像可能存在兼容性问题,建议更换驱动版本,操作指导,请参考安装GPU驱动。 否,请执行下一步。
参数类型 描述 subnet_id String 网卡所属子网ID。 ip_address String 网卡IP地址。 请求示例 查询指定ID的云服务器网卡信息。 GET https://{endpoint}/v2.1/{project_id}/servers/{server_id}