检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
本节主要通过vsock示例来介绍如何在Linux环境下开发QingTian Enclave应用程序。本节中提供的vsock程序只支持在Linux环境下运行。 通过该vsock程序,可以帮助开发者了解到父虚拟机和QingTian Enclave间如何进行消息传递从而实现双方交互。该
conf文件,重启后不生效怎么办? 问题现象 修改/etc/security/limits.conf文件,重启后配置项不生效。 可能原因 Linux操作系统云服务器中限制资源使用的配置文件是/etc/security/limits.conf和/etc/security/limits.d/目录,/etc/security/limits
更新安全组信息(废弃) 功能介绍 更新安全组。 当前API已废弃,请使用“更新安全组”。 URI PUT /v2.1/{project_id}/os-security-groups/{security_group_id} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述
删除安全组规则(废弃) 功能介绍 删除安全组规则。 当前API已废弃,请使用“删除安全组规则”。 URI DELETE /v2.1/{project_id}/os-security-group-rules/{security_group_rule_id} 参数说明请参见表1。 表1
获取完成后,您可以安装或更新一键式重置密码插件: 安装单台ECS的一键式重置密码插件(单台操作) 更新单台ECS的一键式重置密码插件(单台操作) 通过脚本批量更新ECS一键式重置密码插件(Linux) 通过脚本批量更新ECS一键式重置密码插件(Windows) 父主题: 管理ECS一键式重置密码插件
通过脚本批量更新ECS一键式重置密码插件(Windows) 操作场景 当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。
可用区之间的数据传输是否需要收费? 同一区域下的可用区不收费,跨区域的可用区则需要收费。 父主题: 区域与可用区
查询智能购买组实例列表 功能介绍 获取智能购买组创建的实例信息。 调试 您可以在API Explorer中调试该接口。 URI GET /v2/{domain_id}/auto-launch-groups/{auto_launch_group_id}/instances 参数说明请参见表1。
查询SSH密钥列表(废弃) 功能介绍 查询SSH密钥信息列表。 当前API已废弃,请使用查询SSH密钥对列表。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.1/{project_id}/os-keypairs 参数说明请参见表1。 表1 参数说明
nr_hugepages配置过大 操作步骤 准备正常实例 准备一台可以正常访问的ECS实例,操作系统与该异常实例保持一致。 可以是已有ECS实例 可以新创建一台ECS实例,具体操作请参见购买并登录Linux弹性云服务器。 创建快照 操作异常实例系统盘前,建议您对该实例系统盘创建快照,避免数据丢失。具体操作请参见创建快照。
查询镜像列表详情(废弃) 功能介绍 查询详细的镜像信息列表。 当前API已废弃,请使用"查询镜像列表"。 URI GET /v2.1/{project_id}/images/detail?name={name}&status={status}&changes-since={cha
创建安全组(废弃) 功能介绍 创建安全组。 当前API已废弃,请使用“创建安全组”。 URI POST /v2.1/{project_id}/os-security-groups 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。
卸载驱动。 方法1:执行nvidia-uninstall命令,卸载驱动。 如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n...卸载驱动。 方法2:查询云服务器安装的驱动版本:whereis nvidia 图2 查询安装的驱动版本 根据查询的驱动版本从NVID
您的服务。 目前仅华北-北京一的TCP 25端口出方向默认被封禁,其他区域TCP 25端口不会封禁。 解决方案 如果您需要使用华为云上的云服务器对外部发送邮件,建议您使用云速邮箱。 建议您使用第三方邮件服务商支持的465端口。 父主题: 弹性公网IP类
unknown_nmi_panic配置为1,将会导致ECS产生非预期的异常重启事件。 约束与限制 本节操作涉及修改系统内核参数,在线修改内核参数会出现内核不稳定,请评估风险后操作。 解决方案 远程登录ECS实例。 执行以下命令,查看ECS实例内核参数kernel.unknown_nmi_panic的值。
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
查询可用区列表(废弃) 功能介绍 查询可用区列表。 调试 您可以在API Explorer中调试该接口。 URI GET /v2.1/{project_id}/os-availability-zone 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id