检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
com/networking/hpc-x 将下载的软件包拷贝到BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压HPC-X工具套件,并修改HPC-X工具套件目录。 # tar -xvf hpcx-v2.2.0-gcc-MLNX_OFED_LINUX-4.3-1.0.1.0-redhat7
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
export MANPATH=$MPI_ROOT/share/man:$MANPATH $ unset MPI_REMSH 执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图1 检查MPI环境变量 在单个BMS上通过Spectrum MPI运行可执行文件。
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 成功关闭防火墙 依次登录集群中所有ECS,重复执行1.a~1.c,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
ofa-v2-cma-roe-enp177s0为配置名称,可以修改,但是要保持所有节点一致,并且后面starccm使用platform方式启动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络)
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 关闭防火墙成功 依次登录集群中所有ECS,重复执行步骤1.1~步骤1.3,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
# iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1.2~步骤1.3,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS, 执行以下命令,添加hosts配置文件。
# cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v 0000 图2 查询pkey值 普通用户下,在~/.bashrc中添加如下语句: export MPI_ROOT=/opt/ibm/platform_mpi export
# iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1.2~步骤1.3,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS, 执行以下命令,添加hosts配置文件。
购买数量:待创建集群中弹性云服务器的数量。 单击“立即购买”。 在确认规格页面,您可以查看详情并提交申请。 如果确认信息无误,单击“提交订单”。 使用私有镜像创建的弹性云服务器创建成功后,您可以在弹性云服务器列表页查看详情,这些云服务器将被用作HPC集群。 API方式 以创建H2型ECS集群为例:
方便的对集群、节点、任务以及共享存储进行查看及管理操作,实现集群的一键式开通和部署等功能。 功能 说明 集群管理 HPC-S²的管理控制台提供了HPC-S²集群相关的集群创建、集群进度(包括创建/部署/扩容/缩容等操作)查看、集群详情查看、对集群进行管理(包括扩容、启动、停止、删除等操作)、实例topo管理的功能。
协议,单击“提交”。 提交/支付成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“创建中”了,等待集群创建完成变成“运行中”代表集群创建完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
# iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1.2~步骤1.3,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS, 执行以下命令,添加hosts配置文件。
创建HPC私有镜像 前提条件 创建镜像需选择ECS系统盘镜像。 需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。
已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动。 执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-3.1.0rc2/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 确认已安装IB驱动 查看回显结果。 如果回
已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动 执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-4.0.2a1/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 检查IB驱动 查看回显结果。 如果回显如图
列表中的一个规格后,列表下方会展示该规格的名称、组网、用途等信息,以便您根据实际业务进行选择。 规格中的内存、本地磁盘等配置为固定值,不可更改。 选择“镜像”。 公共镜像 常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用。 选择“公共镜像”,并展开“镜像”的下拉框,选择所需的公共镜像。
配置ECS集群互相免密登录 操作场景 该任务指导用户在ECS集群上进行相关设置,并使其可以相互免密登录。仅支持在使用密钥登录弹性云服务器的情况下配置ECS集群互相免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo
0rc6/lib64 执行以下命令,导入配置的MPI环境变量。 # source ~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 # which mpirun 图2 查看MPI环境变量 系统回显结果如图2所示,则环境配置正常。 执行以下命令,在单个弹性云服务器上运行Intel