检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
communicate with the NVIDIA diver。 判断方式 执行以下命令,查看当前内核版本。 uname -r 根据不同的系统在服务器中执行以下命令,查看安装驱动时的内核版本。 CentOS:find /usr/lib/modules -name nvidia.ko Ubuntu:find
问题现象 在云服务器执行以下命令查看系统当前版本: /etc/redhat-release 得到当前云服务器版本为CentOS 7.6。但在控制台使用的镜像为CentOS 7.2(或者低于7.6的其他版本)。 本节操作适用于CentOS、EulerOS操作系统云服务器。 根因分析
通过脚本批量更新ECS一键式重置密码插件(Windows) 操作场景 当您需要对多台Windows系统的云服务器批量更新一键式重置密码插件时,可参考本文档操作。 前提条件 准备好执行机,执行机需满足的条件请参见约束与限制。 需要提前准备待批量安装插件的云服务器的IP地址、Administrator用户的密码信息。
排查思路 可能原因 处理措施 ECS网卡对应安全组规则未放通 解决方法请参考ECS网卡对应安全组规则未放通。 ECS网卡所在子网关联的网络ACL规则未放通 解决方法请参考ECS网卡所在子网关联的网络ACL规则未放通。 ECS网卡内部网络配置问题 解决方法请参考ECS网卡内部网络配置问题。
参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 参数类型 描述 keypairs Array of objects 密钥信息列表,详情请参见表3。
参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 是否必选 参数类型 描述 floating_ips 是 Array of objects
conf文件,重启后不生效怎么办? 问题现象 修改/etc/security/limits.conf文件,重启后配置项不生效。 可能原因 Linux操作系统云服务器中限制资源使用的配置文件是/etc/security/limits.conf和/etc/security/limits.d/目录,/etc/security/limits
项目ID。 获取方法请参见获取项目ID。 security_group_rule_id 是 安全组规则ID,在URI中指定。 请求消息 无 响应消息 无 请求示例 请求示例 DELETE https://{endpoint}/v2.1/3d72597871904daeb6887f75
短期处理方法: 执行以下命令重启NetworkManager服务。 systemctl restart NetworkManager 长期处理方法: CentOS 7操作系统云服务器 执行以下命令停止NetworkManager服务,改用network管理网络 systemctl disable
描述 href string 相应资源的链接。 rel string self:自助链接包含版本链接的资源。立即链接后使用这些链接。 bookmark:书签链接提供了一个永久资源的永久链接,该链接适合于长期存储。 alternate:备用链接可以包含资源的替换表示形式。 例如,Op
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的目
显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题。 如果风扇显示ERR!,可能是因为显卡过热,用户先停止业务,待
Inode节点耗尽导致无法创建新文件问题处理 问题现象 创建文件或者目录时失败,提示没有可用空间:No space left on device,cannot create directory,Cloudn't create temporary archive name。 根因分析
是否可以在不同的区域之间实施应用灾备? 可以。 您可以将应用的主备节点部署到不同的区域,当主节点应用出现故障,备节点应用可以继续为您的客户提供服务。 父主题: 区域与可用区
创建安全组(废弃) 功能介绍 创建安全组。 当前API已废弃,请使用“创建安全组”。 URI POST /v2.1/{project_id}/os-security-groups 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。
如果用户使用的是vGPU实例,确认实例安装的驱动与主机的驱动版本是否匹配。 登录实例所在主机。 执行nvidia-smi命令,查看驱动版本,并对照版本配套关系。 版本配套关系:https://docs.nvidia.com/grid/index.html 处理方法 重启GPU弹性云服务器。
root用户用passwd命令修改管理员用户以及普通用户的密码时失败,提示passwd:Authentication token manipulation error。 根因分析 出现该问题通常是密码文件的属性的问题导致,也有可能是根目录空间满。 执行以下命令查看存放用户和密码的
更新安全组信息(废弃) 功能介绍 更新安全组。 当前API已废弃,请使用“更新安全组”。 URI PUT /v2.1/{project_id}/os-security-groups/{security_group_id} 参数说明请参见表1。 表1 参数说明 参数 是否必选 描述
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
参数说明请参见表1。 表1 参数说明 参数 是否必选 描述 project_id 是 项目ID。 获取方法请参见获取项目ID。 请求消息 无 响应消息 响应参数如表2所示。 表2 响应参数 参数 是否必选 参数类型 描述 floating_ip_pools 是 Array of objects