检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本文档将以部署一台Web应用服务器为场景,帮助您学习如何创建和使用裸金属服务器。通过本文档,您可以学习到如何挑选合适的服务器,如何登录服务器,以及部署Nginx软件。 仅适用于管理控制台操作。如果您是API用户,请参考API参考。 您将按以下流程学习如何使用裸金属服务器。 图1 入门流程 父主题:
图2 不同子网NPU卡间的网络 智能调度 AI大模型训练会将训练任务切分到多个计算节点进行分布式并行训练,会在节点之间引入复杂的通信行为,导致训练效率下降,智能调度通过考虑分布式训练通信的复杂性和集群带宽多级收敛的特性,根据大模型训练任务特征,并行度及可用资源拓扑信息,提供基于拓扑感
如何设置SSH服务配置项? 您可以根据需要选择登录裸金属服务器的登录方式或账户类型,如果需要特殊配置,可执行以下操作: 如果要禁用密码远程登录,仅支持证书登录的方式,以提高裸金属服务器的安全性,可设置如下参数: 查看文件“/etc/cloud/cloud.cfg”中是否存在参数“
本节介绍REST API请求的组成,并以调用IAM服务的管理员创建IAM用户来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
升级前必读 升级影响 升级过程禁止进行其他维护操作动作。 Atlas 800 训练服务器(型号9000)软件版本升级过程中需要复位系统,会导致业务中断。 注意事项 Atlas 800 训练服务器(型号9000)版本升级时的注意事项如表1所示。 表1 升级时注意事项 序号 描述 1
(GB) 无 2 x 2*10GE + SDI卡 GPU加速型 提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。特别适合于深度学习、科学计算、CAE、3D动画渲染、CAD等应用。 表5 GPU加速型规格详情 规格名称/ID CPU 内存 本地磁盘 扩展配置 physical
成本管理 随着上云企业越来越多,企业对用云成本问题也越发重视。使用裸金属服务器时,如何进行成本管理,减轻业务负担呢?本文将从成本构成、成本分配、成本分析和成本优化四个维度介绍成本管理,帮助您通过成本管理节约成本,在保障业务快速发展的同时获得最大成本收益。 成本构成 使用裸金属服务器时,成本主要包括两个方面:
页签,具体操作请参见如何恢复为手动续费。 手动续费资源。 单个续费:在资源页面找到需要续费的资源,单击操作列的“续费”。 图3 单个续费 批量续费:在资源页面勾选需要续费的资源,单击列表左上角的“批量续费”。 图4 批量续费 选择裸金属服务器的续费时长,判断是否勾选“统一到期日”
设置“Formatting Options”和“Mounting Options”,单击“Finish”完成根分卷的创建。 至此,根分卷已经创建完成,后续步骤介绍如何创建Swap分卷。 在左侧导航中选择“Volume Management”,单击“Add > Logical Volume”创建逻辑卷。
对于关键类应用或性能要求较高的业务(如大数据集群、企业中间件系统),并且要求安全可靠的运行环境,建议您使用裸金属服务器进行部署。 下面介绍如何调用创建裸金属服务器API创建裸金属服务器,API的调用方法请参见如何调用API。 目前仅支持创建包年/包月裸金属服务器。 前提条件 您需要规划裸金属服务器所在的区域信息,并
升级昇腾服务器芯片驱动 操作场景 该任务指导用户升级Atlas 800 训练服务器(型号9000)昇腾服务器芯片的驱动。 run升级包支持一键式升级,本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-driver_x.x.x_euleros2.8-aarch64
GPU加速型实例包括计算加速型(P系列)和图形加速型(G系列),提供优秀的浮点计算能力,从容应对高实时、高并发的海量计算场景。特别适合于深度学习、科学计算、CAE、3D动画渲染、CAD等应用。 表5 GPU加速型规格详情 规格名称/ID CPU 内存 本地磁盘 扩展配置 physical
升级昇腾服务器芯片固件 Atlas 800 训练服务器(型号9000)支持昇腾服务器芯片固件升级。本章节以Atlas 800 训练服务器(型号9000)的A800-9000-npu-firmware_x.x.x.run包为例介绍升级固件的相关操作。 操作步骤 参照升级前准备准备软
鲲鹏+D910裸金属训练集群上线 鲲鹏920+昇腾910处理器的AI训练服务器集群,具有超高算力密度、能效比和网络带宽的特点;整机192 核,8* D910 AI芯片,单芯片可提供256 TFLOPS FP16算力;卡间支持100Ge RDMA高带宽低时延互联;广泛应用于深度学习模型开发和
版本号,“Version:”后面的字段为NPU驱动版本号。 其他命令使用请参考《Atlas 800 训练服务器 npu-smi 命令参考 (型号9000)》。 3. 如果卸载过程中无错误信息提示,则表示卸载成功,根据系统提示信息决定是否重启服务器,完成对软件包的卸载. 父主题: 安装与维护
仅支持同一个操作系统重装。 重装系统界面不会显示本地磁盘裸金属服务器的系统盘容量。 对于快速发放裸金属服务器,重装过程中,如果操作系统所在的云硬盘被删除,则重装失败。 重装过程不支持用户数据注入。 处于维护态的裸金属服务器不能进行重装操作系统操作。 前提条件 待重装操作系统的裸金属服务
升级前检查表 序号 项目 检查标准 1 检查软件版本 查询并记录当前系统中Atlas 800 训练服务器(型号9000)版本。 确认需要升级的版本。 2 检查系统状态 检查Atlas 800 训练服务器(型号9000)告警: 未出现告警,可直接升级。 出现告警时,请与技术支持确认告警情况,然后再决定下一步动作。
用户管理”页面,选择目标用户,单击操作列的“加入到用户组”,在左侧区域选择已设置策略的用户组,移入右侧区域,完成授权过程。 关联资源与企业项目 企业项目还有个重要功能,即提供云资源按企业项目统一管理,那么如何将裸金属服务器资源与企业项目关联?如下所述: 新购裸金属服务器时选择企业项目 在购买裸金属服务
裸金属服务器提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 终端节点 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询BMS服务的终端节点。
如果您忘记了裸金属服务器的登录密码,或者您想加固密码提升安全性,可以在控制台上进行密码重置。 对于“运行中”的裸金属服务器,在控制台上修改密码后,重置密码过程中会自动重启。为了避免数据丢失,请提前规划好操作时间,建议在业务低谷时操作,将影响降到最低。 前提条件 重置密码功能依赖“CloudRes