检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
升级昇腾服务器芯片驱动 操作场景 该任务指导用户升级Atlas 800 训练服务器(型号9000)昇腾服务器芯片的驱动。 run升级包支持一键式升级,本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-driver_x.x.x_euleros2.8-aarch64
图2 不同子网NPU卡间的网络 智能调度 AI大模型训练会将训练任务切分到多个计算节点进行分布式并行训练,会在节点之间引入复杂的通信行为,导致训练效率下降,智能调度通过考虑分布式训练通信的复杂性和集群带宽多级收敛的特性,根据大模型训练任务特征,并行度及可用资源拓扑信息,提供基于拓扑感
升级昇腾服务器芯片固件 Atlas 800 训练服务器(型号9000)支持昇腾服务器芯片固件升级。本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-firmware_x.x.x.run包为例介绍升级固件的相关操作。 操作步骤 参照升级前准备准备软
x86 EulerOS 2.3 UDP报文性能调优 操作场景 用iperf3工具测试网络0丢包最高带宽(UDP 1440字节)和最大pps(UDP 64字节),使用如下指导可以在UDP报文场景下提高网络带宽和pps指标。 操作步骤 SSH登录x86 EulerOS 2.3操作系统,并切换到root用户。
此处以CentOS 7.4 64bit为例,其他操作系统的Nginx启动命令请您自行查阅。 输入wget http://127.0.0.1,测试Nginx服务。 访问Web默认页面 使用浏览器访问“http://裸金属服务器的弹性公网IP地址”,看到Nginx的欢迎页面即表示安装成功。
此处以CentOS 7.4 64bit为例,其他操作系统的Nginx启动命令请您自行查阅。 输入wget http://127.0.0.1,测试Nginx服务。 访问Web默认页面 使用浏览器访问“http://裸金属服务器的弹性公网IP地址”,看到Nginx的欢迎页面即表示安装成功。
(GB) 无 2 x 2*10GE + SDI卡 GPU加速型 提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。特别适合于深度学习、科学计算、CAE、3D动画渲染、CAD等应用。 表5 GPU加速型规格详情 规格名称/ID CPU 内存 本地磁盘 扩展配置 physical
升级前必读 升级影响 升级过程禁止进行其他维护操作动作。 Atlas 800 训练服务器(型号9000)软件版本升级过程中需要复位系统,会导致业务中断。 注意事项 Atlas 800 训练服务器(型号9000)版本升级时的注意事项如表1所示。 表1 升级时注意事项 序号 描述 1
面网络实现裸金属服务器内NPU卡的互通互联,可提供大规模集群网络拓扑管理和智能调度能力,同时,结合网络大脑的故障快速感知恢复能力,可为AI训练和推理场景提供大规模高性能高可靠的网络通信。 高速网络栈相比传统网络具有如下优势: 性能优异:提供高速带宽互联网络,满足多种应用场景需求。
步骤4:释放裸金属服务器 操作场景 如果您已完成业务测试或体验,不再需要裸金属服务器,请释放该服务器,避免继续产生费用。 包年/包月购买的裸金属服务器,只能通过“退订”来释放。 退订规则请参见“裸金属服务器退订时怎么扣费?”。 操作步骤 登录云服务器控制台https://console
本文档将以部署一台Web应用服务器为场景,帮助您学习如何创建和使用裸金属服务器。通过本文档,您可以学习到如何挑选合适的服务器,如何登录服务器,以及部署Nginx软件。 仅适用于管理控制台操作。如果您是API用户,请参考API参考。 您将按以下流程学习如何使用裸金属服务器。 图1 入门流程 父主题:
升级前检查表 序号 项目 检查标准 1 检查软件版本 查询并记录当前系统中Atlas 800 训练服务器(型号9000)版本。 确认需要升级的版本。 2 检查系统状态 检查Atlas 800 训练服务器(型号9000)告警: 未出现告警,可直接升级。 出现告警时,请与技术支持确认告警情况,然后再决定下一步动作。
写速率中等、事务性处理较少的应用场景,例如企业的日常办公应用或者小型测试等。 高IO:该类型云硬盘的最大IOPS可达5000,最低读写时延为1ms,适用于主流的高性能、高可靠应用场景,例如企业应用、大型开发测试以及Web服务器日志等。 超高IO:该类型云硬盘的最大IOPS可达33
鲲鹏+D910裸金属训练集群上线 鲲鹏920+昇腾910处理器的AI训练服务器集群,具有超高算力密度、能效比和网络带宽的特点;整机192 核,8* D910 AI芯片,单芯片可提供256 TFLOPS FP16算力;卡间支持100Ge RDMA高带宽低时延互联;广泛应用于深度学习模型开发和
步骤回显中“npu-smi”后面的字段为NPU工具版本号,“Version:”后面的字段为NPU驱动版本号。 其他命令使用请参考《Atlas 800 训练服务器 npu-smi 命令参考 (型号9000)》。 版本安装注意事项 查看日志时需注意:日志时间采用的是系统时间,device侧时间与
步骤回显中“npu-smi”后面的字段为NPU工具版本号,“Version:”后面的字段为NPU驱动版本号。 其他命令使用请参考《Atlas 800 训练服务器 npu-smi 命令参考 (型号9000)》。 3. 如果卸载过程中无错误信息提示,则表示卸载成功,根据系统提示信息决定是否重启服务器,完成对软件包的卸载
GPU加速型实例包括计算加速型(P系列)和图形加速型(G系列),提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。特别适合于深度学习、科学计算、CAE、3D动画渲染、CAD等应用。 表5 GPU加速型规格详情 规格名称/ID CPU 内存 本地磁盘 扩展配置 physical
已按照环境要求(仅Windows镜像涉及)完成ISO文件的驱动安装。 约束与限制 当前仅支持BIOS启动的镜像制作(即不支持V6 CPU服务器及鲲鹏系列服务器) 在制作镜像并测试完成之前请勿关闭或重启虚拟机。 父主题: 创建Windows虚拟机
光驱来进行读取。 本章介绍通过ISO文件创建Linux裸金属服务器私有镜像的操作过程。 约束与限制 为保证镜像制作顺利,若未完成最终镜像的测试,在安装操作系统完成提示的重启之后请勿再次关闭或重启弹性云服务器。 父主题: 创建Linux虚拟机
光驱来进行读取。 本章介绍通过ISO文件创建Linux裸金属服务器私有镜像的操作过程。 约束与限制 为保证镜像制作顺利,若未完成最终镜像的测试,在安装操作系统完成提示的重启之后请勿再次关闭或重启弹性云服务器。 父主题: 创建Linux虚拟机