检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
nd-drivers/linux/mlnx_ofed/,选择相应版本的InfiniBand网卡驱动下载,并根据Mellanox提供的操作指导进行安装。 以操作系统CentOS 7.3为例,推荐安装4.2.1版本的安装包,下载安装包“MLNX_OFED_LINUX-4.2-1.2.0
查看集群扩容的进度 操作场景 集群扩容的命令下发之后,如需查看集群的扩容进度,可进入一站式HPC服务提供的“进度”页查看当前集群扩容的具体进展和详细信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要查看的集群,单击操作列的“进度”进入查看。
HPC-S²与其他服务的关系 服务名称 HPC-S²与其他服务的关系 主要交互功能 弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。
操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将ECS对应的密钥文件(.pem文件,假设为*.pem)拷贝至.ssh目录下,命名为“id_rsa”。 $ cd ~/.ssh $ mv *.pem id_rsa
管理集群的共享存储信息 操作场景 集群创建完成后,如需查看集群所使用的共享存储的详细信息,可进入一站式HPC服务提供的“共享存储”页,查看例如集群所使用的SFS的名称和ID、存储协议、共享路径以及挂载点等信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“共享存储”。 在“共
ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP地址和主机名,例如: 192.168.0.1 ecs-ff-0001 192.168.0
本节指导用户在BMS集群上安装和使用Spectrum MPI应用(以版本10.01.01为例)。 对于集群中的每台BMS,都需要执行该操作。 背景信息 IBM Spectrum MPI v10.1版本当前支持的操作系统列表如下: IBM Spectrum MPI 10.1.0.1 Eval for x86_64
firewalld.service 图1 关闭防火墙成功 依次登录集群中所有ECS,重复执行步骤1.1~步骤1.3,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。 # hostname 图2 查看ECS的主机名 依次登录集群中所有ECS,重复执行步骤2
安装和使用IB驱动自带的Open MPI 操作场景 本节操作指导用户在BMS上安装和使用IB驱动自带的Open MPI(以版本4.0.2a1为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动 执行以下命令,查询是否已成功安装IB驱动。
常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 选择“公共镜像”,并展开下拉框,选择所需的公共镜像。 私有镜像 用户基于弹性云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。
安装和使用IB驱动自带的Open MPI 操作场景 本节指导用户在BMS上安装和使用IB驱动自带的Open MPI(以版本3.1.0rc2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动。 执行以下命令,查询是否已成功安装IB驱动。
弹性云服务器场景支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI
鲲鹏裸金属服务器支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI MPICH 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI(鲲鹏BMS场景)
在HPC集群上运行IB驱动自带的OpenMPI 操作场景 该任务指导用户在已配置好的弹性云服务器上,运行IB驱动自带的MPI应用(3.0.0rc6版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使
/etc/hosts 添加的内容为弹性云服务器的主机名及IP地址,例如 #cat /etc/hosts 192.168.1.3 vm1 192.168.1.4 vm2 ... 执行以下命令,添加hostfile文件。 # vi hostfile 添加的内容为集群中参与测试的弹性云服务器的主机名。 vm1
裸金属服务器场景支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI(X86
集群出现异常后,如无法手动进行恢复,可使用集群删除的功能将集群删除,删除时不要勾选“删除云服务器”,然后再使用“已有节点部署集群”的功能重新部署集群。 操作须知 删除集群时,集群管理节点所绑定的EIP资源是不会清理的,需要用户手动删除清理,否则会继续扣费。 删除集群时,如果集群当中的节点挂载了数据盘,集群删
HPC-S²的管理控制台提供了HPC-S²集群的节点进行查询、启动、停止、重启、删除等管理功能。 共享存储 HPC-S²的管理控制台提供了HPC-S²集群所对应的存储信息,通过弹性文件服务(SFS)为集群中所有节点提供文件共享路径。 任务管理 HPC-S²的管理控制台提供了HPC
为什么集群被删除后还在计费? 按需购买的集群删除时未勾选“删除云服务器”,因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的EIP资源也不会删除
集群部署支持鲲鹏架构的sge调度器,支持X86架构的slurm和sge调度器。 单个用户可创建集群的上限为3个。 单个集群中的计算节点的上限为2000个。 集群创建/扩容时,节点不能添加数据盘,如需使用,用户需手动挂载。 当前不支持集群恢复操作,创建失败或扩容失败的节点无法自动恢复。