检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
升级昇腾服务器芯片驱动 操作场景 该任务指导用户升级Atlas 800 训练服务器(型号9000)昇腾服务器芯片的驱动。 run升级包支持一键式升级,本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-driver_x.x.x_euleros2.8-aarch64
图2 不同子网NPU卡间的网络 智能调度 AI大模型训练会将训练任务切分到多个计算节点进行分布式并行训练,会在节点之间引入复杂的通信行为,导致训练效率下降,智能调度通过考虑分布式训练通信的复杂性和集群带宽多级收敛的特性,根据大模型训练任务特征,并行度及可用资源拓扑信息,提供基于拓扑感
升级昇腾服务器芯片固件 Atlas 800 训练服务器(型号9000)支持昇腾服务器芯片固件升级。本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-firmware_x.x.x.run包为例介绍升级固件的相关操作。 操作步骤 参照升级前准备准备软
裸金属服务器与专属主机有什么区别? 裸金属服务器与专属主机均提供独立的物理机,但两者存在如下区别: 裸金属服务器属于裸金属架构,上面没有提供虚拟化平台。 专属主机搭载了华为云虚拟化系统,购买之后可以直接使用ECS的公共镜像发放虚拟机。 详细说明如表1所示。 表1 裸金属服务器与专属主机对比 对比项 裸金属服务器
由于镜像文件不同,安装步骤稍有不同,请根据实际的安装界面提示进行操作。 请根据实际情况完成时区、KMS地址、补丁服务器、输入法、语言等相关配置。 前提条件 已使用平台提供的“远程登录”方式(即VNC登录),连接云服务器并进入安装界面。 操作步骤 操作系统安装成功前,禁止关闭或重启弹性云服务器,否则会导致操作系统安装失败。
鲲鹏+D910裸金属训练集群上线 鲲鹏920+昇腾910处理器的AI训练服务器集群,具有超高算力密度、能效比和网络带宽的特点;整机192 核,8* D910 AI芯片,单芯片可提供256 TFLOPS FP16算力;卡间支持100Ge RDMA高带宽低时延互联;广泛应用于深度学习模型开发和
型的操作系统,指导您完成私有镜像的制作。 当然,您还可以根据实际需要选择安装其他软件,定制您的私有镜像。 私有镜像文件制作完成后,需要在云平台上进行注册,具体操作请参见《裸金属服务器用户指南》的“注册私有镜像”章节。注册成功后,您才可以在申请裸金属服务器时选择到该私有镜像。 父主题:
通过外部镜像文件创建私有镜像 操作场景 您可以通过外部镜像文件创建私有镜像并在云平台上完成注册。创建私有镜像的过程如图1所示。 图1 创建过程 步骤说明如下: 准备镜像文件,请参考《裸金属服务器私有镜像制作指南》了解详细步骤。 上传外部镜像文件到OBS个人桶中,请参考上传外部镜像文件。
本文档将以部署一台Web应用服务器为场景,帮助您学习如何创建和使用裸金属服务器。通过本文档,您可以学习到如何挑选合适的服务器,如何登录服务器,以及部署Nginx软件。 仅适用于管理控制台操作。如果您是API用户,请参考API参考。 您将按以下流程学习如何使用裸金属服务器。 图1 入门流程 父主题:
升级前必读 升级影响 升级过程禁止进行其他维护操作动作。 Atlas 800 训练服务器(型号9000)软件版本升级过程中需要复位系统,会导致业务中断。 注意事项 Atlas 800 训练服务器(型号9000)版本升级时的注意事项如表1所示。 表1 升级时注意事项 序号 描述 1
注册ISO文件(Linux) 操作场景 通过注册镜像操作,将外部镜像ISO文件注册为云平台的私有镜像,即ISO镜像。注册镜像前,需先将ISO文件上传到OBS桶中。 约束与限制 如果制作的是鲲鹏服务器镜像,“架构类型”必须选择“ARM”,并且请确保所在Region可以创建鲲鹏云服务器。
注册ISO文件(Windows) 操作场景 通过注册镜像操作,将外部镜像ISO文件注册为云平台的私有镜像,即ISO镜像。注册镜像前,需先将合成镜像的ISO文件上传到OBS桶中。 前提条件 待注册文件必须为iso格式。 已上传ISO镜像文件到个人OBS桶中。 ISO镜像文件名称只能
通过Dism++为ISO文件集成virtio驱动 操作场景 由于Windows操作系统采用ide磁盘和virtio网卡,因此需要在注册为云平台的镜像前,先在Windows操作系统的ISO文件中集成virtio驱动。由于ISO通常是将光盘文件做成一个文件,而部分光盘软件设定只能从光
华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以
如何申请扩大裸金属服务器资源配额? 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
升级前检查表 序号 项目 检查标准 1 检查软件版本 查询并记录当前系统中Atlas 800 训练服务器(型号9000)版本。 确认需要升级的版本。 2 检查系统状态 检查Atlas 800 训练服务器(型号9000)告警: 未出现告警,可直接升级。 出现告警时,请与技术支持确认告警情况,然后再决定下一步动作。
步骤回显中“npu-smi”后面的字段为NPU工具版本号,“Version:”后面的字段为NPU驱动版本号。 其他命令使用请参考《Atlas 800 训练服务器 npu-smi 命令参考 (型号9000)》。 3. 如果卸载过程中无错误信息提示,则表示卸载成功,根据系统提示信息决定是否重启服务器,完成对软件包的卸载
元数据 元数据介绍 裸金属服务器元数据包含了裸金属服务器在云平台的基本信息,例如服务器ID、主机名、网络信息等。裸金属服务器元数据支持两种风格,可以分别通过兼容OpenStack和兼容EC2的API获取,如表1所示。 表1 裸金属服务器元数据类别支持列表 元数据类型 实例元数据项
查询裸金属服务器元数据(废弃) 功能介绍 裸金属服务器元数据包含了裸金属服务器在云平台的基本信息,例如服务器ID、主机名、网络信息等。通过该接口,您可以查询裸金属服务器的元数据。 当前API已废弃,请使用“查询裸金属服务器详情”。 约束 不支持分页查询。 URI GET /v2.
调整资源配额 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台裸金属服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 裸金属服务器没有独立的服务配额,它的实例数、核心数和RAM容量与