检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云服务器控制台管理(OpenStack Nova API) 获取弹性云服务器的控制台日志(废弃) 获取VNC远程登录地址(微版本2.6及以上)(废弃) 父主题: 历史API
ian架构的独特设计和基于华为自研智能网卡的可信根证书,共同实现隔离。由华为云开发和设计的极简QingTian Hypervisor可以将服务器的物理资源进行分区。相比于其他虚拟化技术,QingTian Hypervisor裁减了所有不必要的功能。QingTian Enclave扩展了QingTian
一般情况下,竞享实例回收会优先选择使用时长较短的实例中断回收,尽可能降低对用户的业务损伤,但仍然建议您优化应用设计,保证在竞享实例被中断回收的情况下业务也可以正常工作。您可以尝试主动释放竞享实例,检测在竞享实例被中断回收的情况下应用工作是否正常。 图1 竞享实例的生命周期 在保障周期内由云平台中
选择“云硬盘”页签,并单击数据盘所在行的“卸载”,卸载该云硬盘。 准备一台大规格的磁盘增强型弹性云服务器。 该云服务器的规格大于原云服务器规格,且其本地盘容量能够满足用户的需求。 挂载云硬盘至大规格的磁盘增强型弹性云服务器。 在弹性云服务器页面,单击步骤5中准备的弹性云服务器名称,展开详情。
申请开通弹性云服务器需要多久? 通常几分钟之内即可开通成功。 具体的,与该弹性云服务器的规格、配置资源(如云硬盘、弹性公网IP),以及当前的系统负载有关。 如果长时间无法开通,请联系客服寻求技术支持。 父主题: ECS创建
GPU实例故障自诊断 GPU实例故障,如果已安装GPU监控的CES Agent,当GPU服务器出现异常时则会产生事件通知,可以及时发现问题避免造成用户损失。如果没有安装CES Agent,只能依赖用户对故障的监控情况,发现故障后及时联系技术支持处理。 GPU实例故障处理流程 GPU实例故障分类列表
Message显示依赖服务的错误消息时,处理措施需要联系技术支持。 在管理控制台进行操作时,如果显示错误码,错误码说明请参见《弹性云服务器用户指南》的常见问题“针对管理控制台的异常提示信息,应该如何处理”。 错误码说明 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。
stream,推送缓冲区流无效或损坏 74 NVLINK Error. NVLink异常产生的XID,表明GPU硬件故障需要下线维修。 79 GPU has fallen off the bus。总线脱落,需要下线维修 详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/
非硬件故障自恢复处理方法:这类问题可以根据指导自行排查恢复。 显卡故障诊断及处理方法:这类问题可以根据指导确认后联系技术支持。 联系技术支持人员:无法自恢复请提交工单联系技术支持人员获取帮助。 图1 GPU实例故障处理流程 父主题: GPU实例故障自诊断
详情可以参考NVIDIA的Xid描述文档:https://docs.nvidia.com/deploy/xid-errors/index.html。 处理方法 尝试重新运行作业并观察Xid错误是否消失。 若错误持续存在,尝试检查代码或分析日志,确认是否为程序引入的Xid故障。 若确认不是程序引入,请联系技术支持处理。
占用大量的CPU资源。 使用top命令终止CPU占用率高的进程 您可以直接在top运行界面快速终止相应的异常进程。操作步骤如下: 在top命令运行的同时,按下小写的“k”键。 输入要终止进程的PID。 进程的PID为top命令回显的第一列数值。例如,要终止PID为52的进程,直接输入“52”后回车。
让您的应用不再受限硬件配置。 硬件加速器资源池 FPGA云服务的硬件加速资源以池化的形式呈现,像分配CPU资源一样,按照您的需求分配最合适、最经济的FPGA资源。通过FPGA虚拟化技术、隔离技术和分布式技术,可以实现节点内FPGA资源的共享,而这一切对您的业务都是透明的,从而最大化满足您业务的硬件加速需求。
内容(某些内容未被使用)。 问题影响 可能影响ECC相关非易失数据的记录,从而导致本该隔离的GPU内存页面继续使用。 处理方法 用户停止业务并执行业务迁移。 执行业务迁移后,根据故障信息收集收集故障信息后联系技术支持处理。 父主题: 显卡故障诊断及处理方法
注意的是,云服务器关机只是不收取基础资源(vCPU、内存、收费镜像)费用,其上绑定的云硬盘、带宽等仍然正常计费。因此删除云服务器才能避免继续产生费用。 竞价计费资源 对于竞价计费模式的资源,例如竞价计费的弹性云服务器,若不再使用这些资源且需停止计费,请删除相应资源。需要注意的是,
String G1型和G2型云服务器应用的技术,包括GPU虚拟化和GPU直通。 如果该规格的云服务器使用GPU虚拟化技术,且GPU卡的型号为M60-1Q,参数值为“m60_1q:virt:1”。 如果该规格的云服务器使用GPU直通技术,且GPU卡的型号为M60,参数值为“m60:direct_graphics:1”。
根据故障信息收集收集故障信息后联系技术支持检查硬件是否存在问题。 如果风扇显示ERR!,可能是因为显卡过热,用户先停止业务,待显卡缓解过热后再执行nvidia-smi命令,查看ERR!是否消失。 如果回显正常,建议用户调整下业务,限制显卡运行的最大功率。 如果仍未恢复正常,根据故
如何处理GPU掉卡问题 问题描述 执行nvidia-smi命令查询到的显卡的数量较实际规格对应的显卡数量少。 如上图所示,执行nvidia-smi命令查询到7张显卡,实际该机型应有8张显卡。 判断方式 执行以下命令,显卡的数量与实际规格对应的显卡数量一致,且显卡在位状态正常(rev a1),请继
VNC方式登录弹性云服务器后,较长时间不操作,界面无响应? 用户的计算机操作系统为Windows7时,如果使用IE10或IE11浏览器通过VNC方式登录弹性云服务器,且较长时间不做任何操作,VNC登录界面会出现无响应的状况,键盘和鼠标无法正常操作。 此时,可以通过单击两次VNC页面上的“AltGr”按钮重新激活页面。
HANA所需的资源(HANA云服务器、公网IP地址等),并安装和配置SAP HANA,从而提升用户的效率,降低用户的成本,提升用户的体验。 HANA云服务器是指专门为SAP HANA提供的一种云服务器类型。如果您的云服务器上部署了SAP HANA,则可以选择购买HANA类型的弹性云服务器。
事件概述 在日常运维中,华为云会对ECS实例所在底层宿主机的软硬件故障进行预测和主动规避。 当宿主机上的故障风险无法规避时,为避免因ECS实例的资源可用性或性能受损对您的业务造成的更大影响,系统会对受影响的实例生成事件并进行上报,例如实例重部署、本地盘换盘等,事件详细内容请参见事件类型。系统上报事件不会频繁发生。