检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看集群详情页面 操作场景 集群创建完成后,如需查看集群的详细信息,可进入一站式HPC服务提供的“集群详情”页,查看例如当前集群的ID、状态、所在区域、虚拟私有云、安全组、节点信息以及共享存储以及集群的关系图等信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。
下载安装包“MLNX_OFED_LINUX-4.6-1.0.1.1-rhel7.6alternate-aarch64.tgz”。 下载地址:https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/ 图2
1 Eval for x86_64 Linux Red Hat Enterprise Linux version 6.6及其之后的版本 Red Hat Enterprise Linux version 7.1及其之后的版本 SUSE Linux Enterprise Server
安装IB驱动。 下载安装包“MLNX_OFED_LINUX-4.3-1.0.1.0-rhel7.3-x86_64.tgz”。 下载地址:https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/ 图2 IB驱动的下载页面
弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。 创建虚拟私有云和子网 修改虚拟私有云基本信息 镜像服务(IMS)
d-drivers/linux/mlnx_ofed/,选择相应版本的InfiniBand网卡驱动下载,并根据Mellanox提供的操作指导进行安装。 以操作系统CentOS 7.3为例,推荐安装4.2.1版本的安装包,下载安装包“MLNX_OFED_LINUX-4.2-1.2.0
0.0-gcc-MLNX_OFED_LINUX-4.2-1.2.0.0-redhat7.3-x86_64.tbz。 执行以下命令,解压HPC-X工具套件。 # tar -xvf hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4.2-1.2.0.0-redhat7
Spectrum MPI v10.1)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。
高性能计算解决方案适用于基因测序,工业仿真等高性能计算场景,您根据实际计算需求购买HPC集群。 本节操作介绍创建HPC集群的方式,以及创建流程,引导您一站式完成集群的创建、配置,并在HPC-S²上完成高性能计算作业。 部署方式简介 购买高性能计算解决方案:根据实际计算需求购买HP
性能比普通云服务器提高30%。 通过虚拟化优化(SR-IOV、PCI直通)等,各类测试报告显示:大规模云化HPC性能损耗不大。 HPC与云服务的关系 表1 所需云服务 云服务 作用 弹性云服务器(ECS) 用于在公有云平台上创建高性能计算服务器。 虚拟私有云(VPC) HPC场景下所
S7.3为例)上运行Intel MPI应用(l_mpi_2018.0.128版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 关闭防火墙。 登录集群中任意一台ECS。 执行以下命令,关闭ECS防火墙。
3为例)上运行Platform MPI应用(以版本platform_mpi-09.01.04.03r-ce为例)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 关闭防火墙。 登录集群中任意一台ECS。 执行以下命令,关闭ECS防火墙。
HPC解决方案服务的管理控制台提供了弹性文件服务SFS的自定义挂载和卸载的功能。集群创建完成后,您可以在共享存储页面为集群挂载/卸载弹性文件服务。通过弹性文件服务SFS为集群提供共享存储的功能。 当集群为运行状态时,您可以选择挂载/卸载弹性文件服务。当集群在创建中或部署状态时,不支持挂载/卸载共享文件服务。 挂载共享存储
slurm和sge调度器。 单个用户可创建集群的上限为3个。 单个集群中的计算节点的上限为2000个。 集群创建/扩容时,节点不能添加数据盘,如需使用,用户需手动挂载。 当前不支持集群恢复操作,创建失败或扩容失败的节点无法自动恢复。 集群创建/扩容时,公共镜像当前只支持CentOS
PATH=$MPI_ROOT/bin:$PATH export LD_LIBRARY_PATH=/opt/ibm/platform_mpi/lib/linux_amd64 export MPI_IB_PKEY=2.a中获取的pkey $source ~/.bashrc 如果存在多个pkey,使用英文逗号隔开。
PATH=$MPI_ROOT/bin:$PATH export LD_LIBRARY_PATH=/opt/ibm/platform_mpi/lib/linux_amd64 export MPI_IB_PKEY=步骤2.1中获取的pkey $source ~/.bashrc 如果存在多个pkey,使用英文逗号隔开。
选择“登录方式”。 登录方式会和集群初始创建时保持一致,若集群创建时选择了密码方式,扩容就只支持密码方式,若集群创建时选择了密钥方式,扩容则只支持密钥方式。 密钥对 指使用密钥对作为弹性云服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“查看密钥对”创建新的密钥。 如果选择使用已有的密
看及管理操作,实现集群的一键式开通和部署等功能。 功能 说明 集群管理 HPC-S²的管理控制台提供了HPC-S²集群相关的集群创建、集群进度(包括创建/部署/扩容/缩容等操作)查看、集群详情查看、对集群进行管理(包括扩容、启动、停止、删除等操作)、实例topo管理的功能。 节点管理
管理集群的共享存储信息 操作场景 集群创建完成后,如需查看集群所使用的共享存储的详细信息,可进入一站式HPC服务提供的“共享存储”页,查看例如集群所使用的SFS的名称和ID、存储协议、共享路径以及挂载点等信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“共享存储”。 在“共
登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要查看的集群,单击操作列的“进度”进入查看,日志类型选择“部署”,查看当前集群的创建的具体进展和详细信息。 父主题: 查看部署进度