正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
重新分区会导致磁盘数据丢失,请谨慎选择。 手动扩容可能存在风险,请在操作前对进行数据备份,详细内容,请参见创建快照或备份磁盘 。 登录Linux云服务器。 停止与挂载目录相关的进程。 执行以下命令,执行卸载操作(以sdb1为例)。 umount /dev/sdb1 执行以下命令,进行手动扩容。
源隔离操作。隔离操作需要在创建QingTian Enclave虚拟机之前执行。接下来我们将介绍该服务的配置文件/etc/qingtian/enclave/qt-enclave-env.conf: #enclave虚拟机隔离大页内存类型,可配置2或1024,分别表示2M大页或1G大页
查询指定镜像的元数据(废弃) 功能介绍 获取指定镜像的扩展信息。 当前API已废弃,请使用"查询镜像列表"。 URI GET /v2.1/{project_id}/images/{image_id}/metadata 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id
Engine Exception,非硬件故障,可能是指令错误等。 31 GPU memory page fault,非硬件故障,可能访问了非法地址等。 43 GPU stopped processing, 非硬件故障,可能是自身软件错误。 详情可以参考NVIDIA的Xid描述文档:https://docs
删除安全组(废弃) 功能介绍 删除安全组。 当前API已废弃,请使用“删除安全组”。 URI DELETE /v2.1/{project_id}/os-security-groups/{security_group_id} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述
是否可以在不同的区域之间实施应用灾备? 可以。 您可以将应用的主备节点部署到不同的区域,当主节点应用出现故障,备节点应用可以继续为您的客户提供服务。 父主题: 区域与可用区
创建安全组(废弃) 功能介绍 创建安全组。 当前API已废弃,请使用“创建安全组”。 URI POST /v2.1/{project_id}/os-security-groups 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。
删除安全组规则(废弃) 功能介绍 删除安全组规则。 当前API已废弃,请使用“删除安全组规则”。 URI DELETE /v2.1/{project_id}/os-security-group-rules/{security_group_rule_id} 参数说明请参见表1。 表1
包含对端ip网段,cidr格式,参见表7。ip_range或者group参数的值为空。 group 是 Object 包括对端安全组的名称和对端安全组所属租户的租户ID,参见表8,ip_range或者group参数的值为空。 id 是 String 安全组规则ID,UUID格式。
可用区之间的数据传输是否需要收费? 同一区域下的可用区不收费,跨区域的可用区则需要收费。 父主题: 区域与可用区
在这种情况下如果将内核参数kernel.unknown_nmi_panic配置为1,将会导致ECS产生非预期的异常重启事件。 解决方案 远程登录ECS实例。 执行以下命令,查看ECS实例内核参数kernel.unknown_nmi_panic的值。 sysctl -n kernel
Object 对端IP网段,cidr格式,参见表5。 约束:ip_range和group两个参数二选一。 group Object 包括对端安全组的名称和对端安全组所属租户的租户ID,参见表6。 约束:ip_range和group两个参数二选一。 id String 安全组规则ID。 表5
Object 对端IP网段,cidr格式,参见表5。 约束:ip_range和group两个参数二选一。 group Object 对端安全组的名称和对端安全组所属租户的租户ID,参见表6。 约束:ip_range和group两个参数二选一。 id String 安全组规则ID,UUID格式。
以.txt格式保存在本地,保存公钥文件。 将公钥文件导入管理控制台。 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 选择“计算 > 弹性云服务器”。 在左侧导航树中,选择“密钥对”。 在“密钥对”页面,单击“导入密钥对”。 将“.txt”格式文本文档中的公钥内容粘贴至“Public
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
示ERR! 处理方法 如果当前用户业务正常,仅nvidia-smi执行后存在ERR!显示问题,无需处理。 如果当前业务已经受到影响,迁移虚拟机,再根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 非硬件故障自恢复处理方法
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
communicate with the NVIDIA diver。 判断方式 执行以下命令,查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find
如何处理ECC ERROR:存在待隔离页问题 问题描述 业务调度到某个GPU节点后,发现业务异常,调度到其他节点时正常。 某台虚拟机显存使用率突然降低。 判断方式 执行以下命令,查看显卡是否存在ecc error。 nvidia-smi 如果1的回显结果中volatile Uncorr