检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文介绍如何触发和查看操作系统dump的内核转储文件的方法。 触发操作系统dump 查看操作系统dump(Windows) 查看操作系统dump(Linux) 前提条件 已经完成配置操作系统dump。 触发操作系统dump 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
如何处理用户自行安装NVIDIA驱动、CUDA软件,安装过程出错问题 问题描述 用户使用不带驱动的公共镜像或私有镜像,自行安装NVIDIA驱动软件包、CUDA软件包,在安装过程中脚本执行报错。 判断方式 确认用户使用的镜像文件。 确认用户的NVIDIA软件包来源。 确认用户想要的
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
源地址 入方向 1 允许 IPv4 TCP: 80 0.0.0.0/0 为了更好的获取和更新系统和软件,建议您更新镜像源为华为云镜像源,详细操作,请参见如何使用自动化工具配置华为云镜像源(x86_64和ARM)?。 资源规划 本次实践所用的资源配置及软件版本如表2中所示。当您使用不同
快速入门 以下教程将引导您了解并使用QingTian Enclave特性,包括如何启动QingTian Enclave父虚拟机,如何构建QingTian Enclave镜像文件,如何查询正在运行的QingTian Enclave,以及停止QingTian Enclave。 准备一台支持QingTian
通过移动设备登录Linux ECS 操作场景 本节操作介绍如何在移动设备上连接Linux实例。 以Termius为例介绍如何在iOS设备上连接 Linux 实例,详细操作请参考IOS设备上登录Linux云服务器。 以JuiceSSH为例介绍如何在Android设备上连接 Linux 实例,详
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。
如何解决SR-IOV场景下win7弹性云服务器安装82599网卡驱动报错? 问题描述 从Intel官网下载最新的20.4.1版本驱动包(下载地址:https://downloadcenter.intel.com/search?keyword=Intel++Ethernet+Con
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
检查弹性公网IP的带宽是否超限 弹性云服务器绑定了弹性公网IP时,通过带宽提供公网和弹性云服务器间的访问流量。 如果出现访问公网不通,请排查弹性公网IP带宽是否超过带宽最大上限。 排查带宽超限的方法请参考如何排查带宽超过限制? 扩大带宽的操作请参考修改弹性公网IP的带宽。 检查DNS配置
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
具体包括如下第三方软件在弹性云服务器上安装、配置和问题排查的建议。 WEB服务 Apache IIS Nginx 数据库服务 MySQL Microsoft SQL Server 网络安全服务 Linux的Iptables Windows的Firewall 其他网络服务 SSH、Windows远程和路由访问 SFTP、FTP
其他子网不能与指定IP的子网相同。 暂不分配IPv6地址/自动分配IPV6地址:当且仅当选择部分规格的云服务器、且VPC子网开启了IPv6功能时,该参数可见。子网如何开启IPv6功能,请参见“IPv4/IPv6双栈网络”。云服务器是否支持IPv6双栈功能的查看方法请参见动态获取IPv6地址中的“约束与限制”相关内容。
企业只有了解组织中哪些方面产生了成本,才能正确地控制和优化成本。成本中心支持使用“成本分析”的汇总和过滤机制可视化企业的原始成本和摊销成本,从而通过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的“成本监控”,及时发现计划外费用,做到成本的可监控、可分析和可追溯。 详细介绍请参见通
实例重部署预处理 操作场景 对于包含本地盘的云服务器,当进行“本地盘换盘”和“实例重部署”事件的“授权重部署”操作时,需要先对本地盘进行实例重部署预处理,避免云服务器异常风险。 本文介绍如何对Linux操作系统的磁盘增强型(D系列)和超高I/O型(I系列)的ECS实例进行实例重部署的预处理操作。
同的CPU处理,以满足网卡的需求,从而提升网络PPS和带宽性能。 详细操作请参考如何设置镜像的网卡多队列属性? 共享镜像 您将接受其他用户共享的私有镜像,作为自己的镜像进行使用。 市场镜像 市场镜像是提供预装操作系统、应用环境和各类软件的优质第三方镜像。无需配置,可一键部署,满足
检查云服务器路由配置 Linux操作系统云服务器 使用route命令查看路由策略,确保0.0.0.0的默认路由指向网关,使用的IP和网关在相同网段,如下图第1行和第3行所示。 使用ifconfig或者ip addr命令查看实例的IP地址。 图4 ifconfig命令查看IP地址 图5 ip