检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PAGE_RETIREMENT 如果3的回显结果中Pending Page Blacklist为Yes,说明存在待隔离页,需要重新加载驱动去隔离。 处理方法 方法一: 执行以下命令,查看GPU使用情况并停掉所有占用GPU的进程。 nvidia-smi 执行以下命令,重置GPU。 nvidia-smi
能表现差;查看/var/log/messages日志发现有如下报错,询问用户后确认用户购买了License但是未配置License。 处理方法 确认用户业务使用场景是否是做图形处理,用户使用的实例规格是否满足图形处理要求。 用户是否安装GRID驱动,执行nvidia-smi命令查询回显是否正常。
操作系统问题 Windows云服务器带宽和CPU利用率高问题排查方法 Linux云服务器带宽和CPU占用率高问题排查方法 更多操作系统问题请参见操作系统类常见问题。 DNS常见问题 怎么测试域名解析是否生效 解析不生效有哪些原因 更多DNS问题请参见DNS常见问题。 其它常见问题 无法访问ECS实例上运行的网站
kernel module 'nvidia.ko'” 问题原因 总线脱落。 内核版本不一致。 问题影响 显卡驱动安装失败,显卡无法使用。 处理方法 执行以下命令,查看内核版本,检查内核版本是否一致。 rpm -qa | grep gcc #查看gcc版本 rpm -qa | grep
查询云服务器规格列表(废弃) 功能介绍 查询系统中可用的弹性云服务器规格列表。Nova接口到请求消息后,通过nova-api查询数据库中的规格信息。 当前API已废弃,请使用查询规格详情和规格扩展信息列表。 调试 您可以在API Explorer中调试该接口。 URI GET /v2
镜像部署Moodle课程管理系统(Linux) 简介 Moodle是一个开源的课程管理系统,采用PHP+MySQL开发,可以帮助教育者建立有效的在线学习社区,以系统功能强大、界面简洁而著称,您可以根据需要随时调整界面,增减内容。 本文档指导用户使用华为云市场镜像“在线学习系统 Moodle
com/deploy/xid-errors/index.html。 处理方法 执行dmesg | grep –i xid命令,查看是否存在xid报错。 通知用户停止业务,执行业务迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的目标NVIDIA软件包版本以及CUDA软件版本。 处理方法 推荐客户使用自动安装驱动脚本。根据当前华为云驱动自动安装脚本中提供的CUDA版本,按需安装。 GPU加速型实例自动安装GPU驱动(Linux)
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障信息收集
镜像部署LNMP环境(CentOS7.4 PHP7.2) 简介 LNMP是由Linux、Nginx、MySQL和PHP建立的web应用平台。 本文档指导用户使用华为云市场镜像“LNMP平台(CentOS7.4 Nginx PHP7.2)”部署LNMP环境。 操作步骤 在华为云市场搜索“LNMP平台(CentOS7
如客户选择自行安装Tesla驱动,请务必告知客户确保Tesla驱动与CUDA软件的版本配套关系,可参考Tesla驱动及CUDA工具包获取方式。 处理方法 如果用户未安装驱动,请自行安装驱动,或切换带驱动的公共镜像,或使用驱动自动安装脚本安装驱动。 GPU加速型实例自动安装GPU驱动(Linux)
用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果用户使用的是vGPU实例,确认实例安装的驱动与主机的驱动版本是否匹配。 登录实例所在主机。 执行nvidia-smi命令,查看驱动版本,并对照版本配套关系。
farm”,创建一个新的服务器场。 图3 创建Sharepoint服务器场 配置指定数据库设置,由于Sharepoint的数据库在本机,所以填写本机的数据库及账户,单击“Next”。 图4 指定Sharepoint数据库设置 填写服务器场的密码,单击“Next”。 图5 设置Sharepoint服务器场密码
ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc error,执行nvidia-smi
误删除文件的恢复程度与如下因素有关: 文件删除后是否被写覆盖 元数据是否存留在journal 如果误删除的数据位于系统盘,且一直有业务进程或系统进程在写入文件,则可能无法通过此方法进行恢复。 为了提高数据安全性,建议您通过创建快照、创建私有镜像、创建云硬盘备份等方式定期进行数据备份。 本文以操作系统为CentOS
网卡个数上限:指弹性云服务器最多能挂载多少个网卡。 辅助网卡个数上限:指弹性云服务器最多能挂载多少个辅助网卡。 网络收发包测试方法,请参见网络性能测试方法。 开启网卡多队列的方法,请参见开启网卡多队列功能。 最大带宽是实例维度的,即实例如果有多张网卡,所有网卡的最大带宽之和不超过实例的最大带宽。
可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
适用于实例类型,想要根据具体配置要求进行规格选型的用户。 自定义购买ECS 业务场景选型 提供按Web应用、网站应用/电商、游戏、数据库等业务场景以及不同场景业务量的推荐规格。 适用于有明确业务场景需求,想要根据业务场景、业务量等参考指标进行规格选型的用户。 帮我选 提供传统办公、网站应用、电商等
通过华为云云解析服务的快速添加网站域名解析完成解析记录的配置。 修改数据库初始密码。 数据库默认用户为root,默认密码为123456。为保证数据库安全,执行本步骤修改数据库初始密码。 单击“第二步:修改数据库密码”的“马上修改”,进入“phpMyAdmin”页面。 在“常规设置”区域单击“修改密码”。
将访问流量自动分发到多台弹性云服务器上,提高应用系统对外的服务能力,提高应用程序容错能力。 添加后端云服务器 云硬盘 可以将云硬盘挂载到弹性云服务器,并可以随时扩容云硬盘容量。 挂载非共享云硬盘 挂载共享云硬盘 虚拟私有云 为弹性云服务器提供一个逻辑上完全隔离的专有网络,您还可以在VPC中定义安全组、