检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群创建提交失败,提示集群配额不足怎么办? 每个用户只能创建最多3个集群,当集群数量达到上限后会提示该错误,如需创建新集群,可先将不使用或者异常状态的集群进行删除,然后再重新创建集群。 父主题: 常见问题
RoCE概念 RDMA over Converged Ethernet (RoCE)是一种网络协议,允许应用通过以太网实现远程内存访问。目前RoCE有两个协议版本,v1和v2。其中RoCE v1是一种链路层协议,允许在同一个广播域下的任意两台主机直接访问。而RoCE v2是一种Interne
集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 问题描述 集群创建任务提交失败,提示“Insufficient EIP quota”。 处理方法 您可以选择以下任一处理方法: EIP配额不足,创建集群时“弹性公网IP”可选择“使用已有”项。 E
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
添加的内容为集群中参与测试的弹性云服务器的主机名。 vm1 vm2 ... 修改hostfile,运行MPI benchmark,运行时指定hostfile文件路径。 以两个弹性云服务器为例: # mpirun --allow-run-as-root -np 2 --pernode -hostfile /root/hostfile
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master
slots=2 ... 依次登录集群中所有BMS,重复执行步骤2.1~步骤2.2。 在任意一台BMS中执行以下命令,运行社区Open MPI。 以两个BMS为例: $ mpirun -np 2 --pernode -hostfile hostfile /home/rhel/hello 图2
bms-0005 ... 依次登录集群中所有BMS,重复执行2.e~2.f。 在任意一台BMS中执行以下命令,运行社区Open MPI。 以两个BMS为例: $ mpirun -np 2 --pernode -hostfile hostfile /home/rhel/hello 图3
hostname 图2 检查配置文件 回显如图2所示,显示集群中所有BMS的主机名,则表示hostfile文件配置成功。 在任意一台BMS中执行以下命令,运行MPI benchmark,运行时指定hostfile路径。 以两个BMS为例: $ mpirun -np 2 -pernode --hostfile
hostname 图3 检查配置文件 回显如图3所示,显示集群中所有BMS的主机名,则表示hostfile文件配置成功。 在任意一台BMS中执行以下命令,运行MPI benchmark,运行时指定hostfile路径。 以两个BMS为例: $ mpirun -np 2 -pernode --hostfile
hostname 图1 在集群中运行hostname命令 修改hostfile,运行MPI benchmark,运行时指定hostfile文件路径。 以两个弹性云服务器为例: # mpirun --allow-run-as-root -np 2 -pernode --hostfile /root/hostfile
01.01为例)。 对于集群中的每台BMS,都需要执行该操作。 背景信息 IBM Spectrum MPI v10.1版本当前支持的操作系统列表如下: IBM Spectrum MPI 10.1.0.1 Eval for x86_64 Linux Red Hat Enterprise
时的hostlist参数,在集群上通过Spectrum MPI运行可执行文件。其中, IP代表集群中的弹性云服务器IP地址。 Number代表该弹性云服务器的任务数。 假设集群中共有两个弹性云服务器,主机名分别是host-192-168-0-27和host-192-168-0-7
核对当前配置,确认无误后单击“部署HPC集群”,提交创建。 提交成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“部署中”了,等待集群创建完成变成“运行中”代表集群部署完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
MPI(以IBM Spectrum MPI v10.1为例)。 其中,IBM Spectrum MPI v10.1版本当前支持的操作系统列表如下: IBM Spectrum MPI 10.1.0.1 Eval for x86_64 Linux Red Hat Enterprise
0rc6/bin/mpirun 图1 已安装IB驱动 如果上述两条命令均有如图1所示的返回值,则已安装IB驱动,执行3。 如果返回值与图1不同,表示弹性云服务器未安装IB驱动,执行2。 下载并安装对应的IB驱动。 在Mellanox官网https://network.nvidia.co
用户名中超过两个连续字符的部分。 YNbUwp!dUc9MClnv 说明: 样例密码随机生成,请勿复制使用样例。 系统不会定期自动修改弹性云服务器密码。为安全起见,建议您定期修改密码。 设置集群名称。 名称可自定义,但需符合命名规则。集群名称命名规则如表3所示。 表3 集群名称命名规则
配额调整 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
应用的高可用性,建议您将裸金属服务器创建在不同的可用分区。 选择“规格”。 包括CPU、内存、本地磁盘和扩展配置。当您选择规格列表中的一个规格后,列表下方会展示该规格的名称、组网、用途等信息,以便您根据实际业务进行选择。 规格中的内存、本地磁盘等配置为固定值,不可更改。 选择“镜像”。