检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何处理GPU散热异常,执行nvidia-smi命令发现温度过高 问题原因 显卡散热异常、风扇损坏。 问题影响 显卡温度过高,影响用户业务。 处理方法 执行nvidia-smi命令,查看风扇是否正常。 如果风扇转速为0,说明风扇可能存在损坏,用户停止业务,执行业务迁移后,根据故障
com/deploy/xid-errors/index.html。 处理方法 执行dmesg | grep –i xid命令,查看是否存在xid报错。 通知用户停止业务,执行业务迁移,并根据故障信息收集章节收集故障信息后,联系技术支持处理。 父主题: 显卡故障诊断及处理方法
如何处理用户使用场景与其选择的驱动、镜像不配套问题 问题描述 用户业务是做渲染(推理)的,但用户选择了带Tesla驱动(GRID驱动)的公共镜像,运行软件时出错。 例:用户使用场景为做渲染,但选错公共镜像,运行软件时报错“A D3D11-compatible GPU (Feature
访问ECS实例上运行的网站卡顿,如何定位问题? Windows实例CPU使用率高导致卡顿,如何解决? Linux实例CPU使用率高导致卡顿,如何解决? 更多 Ping不通 安全组如何放通icmp协议? 如何配置安全组规则? 安全组典型应用案例 更多 访问外网 如何放通Windows云主机防火墙?
如何处理用户的虚拟机报错:“由于该设备有问题,Windows已将其停止”问题 问题描述 用户在Windows设备管理器显示适配器中查询显卡属性,发现设备状态中存在错误“由于该设备有问题,Windows已将其停止”。 判断方式 确认用户发生问题时的操作,是否有出现显存OOM。 如果
如何处理ECC ERROR:执行nvidia-smi存在SRAM的ECC错误(V100显卡) 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令查看显卡信息。 如果在volatile Uncorr. ECC下发现存在ecc
打开cmd命令窗口,输入“ipconfig /all”,检查使用的DNS服务器是不是华为云默认DNS。 推荐您使用华为云默认DNS地址。 华为云提供的DNS地址请参考华为云DNS地址。 如果使用的是华为云的DNS地址,请执行以下命令检查云服务器与DNS节点之间网络是否连通。 ping
如何调用API 构造请求 认证鉴权 返回结果
使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
针对管理控制台的异常提示信息,应该如何处理? 问题描述 您可以通过本节内容解决如下问题: 用户在管理控制台执行弹性云服务器相关操作后出现异常,针对管理控制台提示的异常信息,应该如何处理? 用户参见《弹性云服务器接口参考》调用云服务器相关的API接口时,如果返回错误码,应该如何处理? 背景知识 用户
务器上运行的某个进程,指定在某个CPU上工作,实现CPU性能调优。 为了获取更高的执行效率,应该保证一个CPU把一个完整的发送或者接收过程处理完,避免CPU切换。最好一个业务进程/线程固定在一个CPU、固定一个网卡发送队列,中断也使用这个CPU。对于跨NUMA的云服务器,应该尽量
换盘预处理 本地盘换盘预处理(磁盘增强型实例) 本地盘换盘预处理(超高I/O型实例) 本地盘换盘预处理(裸金属类型实例) 父主题: 事件管理
conf文件,重启后不生效,则可能是由于limits.conf中的修改被/etc/security/limits.d/目录中配置项的值所覆盖。 解决方案 修改/etc/security/limits.d/目录中配置项或修改/etc/security/limits.conf文件。 如果修改
其他子网不能与指定IP的子网相同。 暂不分配IPv6地址/自动分配IPV6地址:当且仅当选择部分规格的云服务器、且VPC子网开启了IPv6功能时,该参数可见。子网如何开启IPv6功能,请参见“IPv4/IPv6双栈网络”。云服务器是否支持IPv6双栈功能的查看方法请参见动态获取IPv6地址中的“约束与限制”相关内容。
针对Intel处理器芯片存在的Meltdown和Spectre安全漏洞,应该如何规避? 问题描述 北京时间1月3日,Intel处理器芯片被曝出存在严重的Meltdown和Spectre安全漏洞,漏洞详情如下: 漏洞名称:Intel处理器存在严重芯片级漏洞 漏洞编号:CVE-201
安全 责任共担 身份认证与访问控制 数据保护技术 审计与日志 监控安全风险 故障恢复 认证证书 擎天Enclave
安全管理 提升云服务器安全性方法概述 安全组 主机安全 云堡垒机 管理项目和企业项目 敏感操作保护
如何处理ECC ERROR:执行nvidia-smi -q存在double bit ecc error错误,并无待隔离页 问题原因 显存可能某个地方存在异常。 问题影响 可能影响一个或多个GPU的相关应用程序。 处理方法 执行nvidia-smi命令,查看显卡信息。 如果在volatile
Windows弹性云服务器没有声音? 问题描述 购买Windows弹性云服务器后,通过MSTSC远程连接,发现没有声音。通过MSTSC远程连接的Windows弹性云服务器如何播放音频? 约束限制 本节内容适用于Windows Server 2008 R2、Windows Server 2016系统的弹性云服务器。
and virtio driver again! ... Error:ECS modify error! 图1 驱动安装成功但是检查失败 解决方案 请先参考XEN实例变更为KVM实例(Linux-手动配置)中“检查云服务器配置是否成功”的操作步骤检查驱动是否安装成功。 如果驱动安装