检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
如何处理GPU虚拟机故障,在message日志中发现存在Xid报错 问题原因 XID 说明 32 Invalid or corrupted push buffer stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。
通过移动设备登录Linux ECS 操作场景 本节操作介绍如何在移动设备上连接Linux实例。 以Termius为例介绍如何在iOS设备上连接 Linux 实例,详细操作请参考IOS设备上登录Linux云服务器。 以JuiceSSH为例介绍如何在Android设备上连接 Linux 实例,详
以将其添加至开机启动项。具体方法请参见一键式密码重置插件启动失败时如何操作?。 一键式重置密码插件安装成功后,请勿删除重置密码进程CloudResetPwdAgent,否则,会导致一键式重装密码功能不可用。 华为云对一键式重置密码插件进行了升级,对于新创建的弹性云服务器,默认采用
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
eif)。该镜像文件提供了启动QingTian Enclave实例所需要的所有信息,包括应用程序代码、运行时依赖、操作系统和文件系统等。在本节我们将说明如何创建QingTian Enclave镜像文件。 制作docker源镜像 用户将开发好的enclave应用程序及其相关的执行环境打包成doc
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
d事件。 使用私有镜像创建的云服务器需手动安装监控组件并安装驱动。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 已安装GPU驱动,未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。 如果您的弹性云服
在线:Agent运行正常。 离线:Agent与HSS服务器通信异常,HSS无法提供安全防护功能。 单击“离线”,您可以查看Agent不在线的华为云主机列表,并查看“离线原因”。 防护状态 开启:HSS为该服务器提供全面的主机安全防护。 关闭:单击“关闭防护”可以暂停HSS对服务器的防护,降低该服务器的资源消耗。
如何处理GPU掉卡,执行lspci | grep -i nvidia命令找不到显卡或显卡显示rev ff 问题原因 某种健全性检查没有通过,GPU驱动程序不会使用或信任其内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。
参数 参数类型 是否必选 描述 location String 是 FPGA逻辑文件在OBS桶中的路径,格式为“桶名:文件名”,例如“obs-fpga:fpga.bin”。 桶名的命名规则满足OBS的约束: 由英文小写字母、数字以及特殊字符“.”、“-”组成。 只能以数字或字母开头和结尾。
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile
高频常见问题 远程登录 如何进行弹性云服务器的一键诊断? 无法登录到Windows云服务器怎么办? 无法登录到Linux云服务器怎么办? 远程登录时需要输入的账号和密码是多少? Windows云服务器如何配置多用户登录? 申请多用户会话授权的license并激活云服务器 云服务器故障/卡顿
通过VNC登录Linux ECS 操作场景 本节为您介绍如何通过控制台提供的远程登录功能(即VNC方式)登录到弹性云服务器上。 当您无法使用CloudShell文件或其他远程登录工具连接弹性云服务器时,可以选择通过VNC方式进行登录,该登录方式主要用于紧急运维场景,可查看弹性云服务器状态或进行相关维护操作。
元。同理,您可以计算剩余计费周期内资源的官网价。 优惠金额 用户使用云服务享受折扣优惠如商务折扣、伙伴授予折扣以及促销优惠等减免的金额。基于官网价的优惠金额。 抹零金额 华为云产品定价精度为小数点后8位(单位:元),因此在计费过程中会产生小数点后8位的资源使用费用。而在实际扣费时,仅扣除到小数点后2位,小数点后第
手动续费 包年/包月云服务器从购买到被自动删除之前,您可以随时在ECS控制台为云服务器续费,以延长云服务器的使用时间。 在云服务控制台续费 登录管理控制台。 单击左侧导航栏的图标,选择“计算 > 弹性云服务器 ECS”。 在弹性云服务器列表页,选中待续费的包年/包月云服务器。 单击“操作”列下的“更多
在ECS的控制台单击即可查看监控指标。 图3 查看云服务器监控指标 开启防DDoS攻击 针对DDoS攻击,华为云提供多种安全防护方案,您可以根据您的实际业务选择合适的防护方案。华为云DDoS防护服务(Anti-DDoS Service,简称AAD)提供了DDoS原生基础防护(Anti
在弹性云服务器上运行某业务时,系统提示所需端口被一键式重置密码Agent插件占用。那么,一键式重置密码插件占用的端口与业务端口发生冲突时,应当如何处理? 问题原因 对于采用AUTO模式的弹性云服务器,一键式重置密码插件启动时,会随机选取端口进行使用,可能占用了业务端口。 一键式重置密码插件已经升级,默认采用PIPE模式。
时,可使用一键诊断工具检测当前弹性云服务器的主机、安全组、内存、磁盘等状态,帮您进一步进行问题排查及定位。 远程登录诊断工具的操作,请参见如何进行弹性云服务器的一键诊断?。 如果远程登录诊断工具无法帮助您准确定位问题,请记录诊断报告中的异常项,然后单击管理控制台右上方的“工单”,填写工单信息,获取技术支持。