检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
硬件准备 首先需要准备一台Linux系统的物理服务器作为镜像制作服务器(即宿主机),以及一台用于登录宿主机的本地Windows跳板机(物理服务器或虚拟机)。 制作x86镜像选用x86服务器,制作ARM镜像选用ARM服务器。
修改引导的硬件设备驱动 操作场景 此操作主要是在系统启动阶段,针对加载的实际物理服务器的硬件设备驱动所进行的。 前提条件 已登录虚拟机。 操作步骤 增加或修改驱动。
裸金属服务器支持从现有操作系统进行重装,但如果涉及升级场景,如升级内核或某些与网络服务、硬件驱动相关的软件安装包,请和云服务商确认是否需要重新安装硬件驱动(例如raid卡驱动、网卡驱动等)和对应服务包。
安装chipset驱动 操作背景 chipset为Windows主板驱动,如果不安装会影响其他硬件的性能发挥,还可能导致其他硬件的驱动工作不正常。 本文以Windows Server 2016为例,Windows Server 2012 R2与之类似。
支持的监控指标 支持的监控指标 裸金属服务器使用CES主机监控后可以支持CES Agent基础监控指标和硬件监控指标,详细列表请参见主机监控指标。
图2 不同子网NPU卡间的网络 智能调度 AI大模型训练会将训练任务切分到多个计算节点进行分布式并行训练,会在节点之间引入复杂的通信行为,导致训练效率下降,智能调度通过考虑分布式训练通信的复杂性和集群带宽多级收敛的特性,根据大模型训练任务特征,并行度及可用资源拓扑信息,提供基于拓扑感知的亲和性部署和路径规划能力
鲲鹏920+昇腾910处理器的AI训练服务器集群,具有超高算力密度、能效比和网络带宽的特点;整机192 核,8* D910 AI芯片,单芯片可提供256 TFLOPS FP16算力;卡间支持100Ge RDMA高带宽低时延互联;广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗
在操作系统中查看硬盘容量时,获得的容量可能会比BMS服务官网标称的容量小,造成该差异的因素有以下几类: 硬件厂商对于存储容量的计算方式和操作系统不同。
安装虚拟机 启动引导文件修改(仅UEFI启动场景涉及) 虚拟机环境配置 安装Cloud-Init 配置Cloud-Init 查看Cloud-Init服务状态 修改引导的硬件设备驱动 安装bms-network-config软件包 安装network服务 安装SDI卡驱动 安装Hi1822
敏捷的部署效率 裸金属服务器基于擎天加速硬件支持云磁盘作为系统盘快速发放;分钟级资源发放,基于统一console控制台、开放API和SDK,支持自助式资源生命周期管理和运维。
准备工作 Windows驱动安装依赖于硬件设备,通过使用Dism++软件在ISO镜像文件中注入驱动的方式进行安装。之后使用注入完成的ISO进行cloudbase-init、bms-network-config等软件的安装。
问题背景 裸金属服务器中SDI、RAID及IB等硬件驱动跟内核相关,不建议升级内核版本。 如果已经升级且相关功能出现异常可按照以下方法进行规避处理。以CentOS 7.2操作系统为例,介绍如何在内核升级后设置从默认内核启动。
卸载卡驱动(SDI 2.2分布式裸金属服务器) 操作背景 当裸金属服务器配套有SDI 2.2硬件时,需要参考本节指导安装Hi1822网卡驱动,以EulerOS 2.3为例进行说明。 前提条件 已登录虚拟机。 已获取Hi1822驱动安装包及管理软件并上传至虚拟机。
卸载卡驱动(SDI 3.0分布式裸金属服务器) 操作背景 当裸金属服务器配套有SDI 3.0硬件时,需要参考本节指导安装Hi1822网卡驱动,以CentOS 7.6为例进行说明。 前提条件 已登录虚拟机。 已获取Hi1822驱动安装包及管理软件并上传至虚拟机。
主机监控概述 主机监控 裸金属服务器不支持云服务基础监控,需要安装CES主机监控Agent获得操作系统行监控、进程监控和硬件指标监控。
增强高速网络基于上一代高速网络进行了软硬件的优化升级,为租户提供更强大的网络功能。 相比上一代高速网络,增强高速网络具有如下优势: 带宽提升至10GE及以上。 租户自定义网络平面数量,最多支持4K个子网。
若制作镜像的环境没有SDI卡硬件支持,在安装完SDI驱动后,会发现设备管理器中的存储控制器存在异常。 打开命令行,进入存放SDI驱动和devcon安装工具的目录下,删除异常的设备节点。
编译网卡驱动 操作背景 当裸金属服务器配套有Hi1822网卡硬件且无发行驱动或升级内核后驱动不可用,需要参考本节指导编译Hi1822网卡驱动,以为例进行说明。 前提条件 已登录虚拟机。 已获取Hi1822驱动源码安装包及管理软件并上传至虚拟机。
高性能计算/AI场景 超算、基因测序、人工智能等高性能计算场景,处理的数据量大,裸金属服务器满足业务对服务器的高计算性能、高稳定性、高实时性的诉求。
配置虚拟机 Linux操作系统,需要完成如下配置: 启动引导文件修改(仅UEFI启动场景涉及) 虚拟机环境配置 安装并配置Cloud-Init 修改引导的硬件设备驱动 (可选)安装bms-network-config软件包 (可选)安装SDI卡驱动 (可选)安装Hi1822网卡驱动