检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
# cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v 0000 图2 查询pkey值 普通用户下,在~/.bashrc中添加如下语句: export MPI_ROOT=/opt/ibm/platform_mpi export
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不
in fi 步骤4 提交作业,且运行期间无中断 在不中断作业的情况下,提交作业并运行,查看作业运行时间。 执行以下命令,提交作业。 qsub job.pbs 作业运行结束后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图3所示,可以看到作业一共运行了4分10秒。 图3
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 成功关闭防火墙 依次登录集群中所有ECS,重复执行1.a~1.c,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
的调度器、域控制器以及运行时的依赖。 计算资源配置:HPC-S²支持计算资源的多种配置管理,包括集群管理、节点管理、扩容集群节点及资源状态查看等。 HPC-S²使用限制 HPC解决方案服务当前只支持“华北-北京一”、“华北-北京四”、“华南-广州”区域,推荐使用“华北-北京四”,其他区域暂不支持。
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 关闭防火墙成功 依次登录集群中所有ECS,重复执行步骤1.1~步骤1.3,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
协议,单击“提交”。 提交/支付成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“创建中”了,等待集群创建完成变成“运行中”代表集群创建完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
bashrc 验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时
核对当前配置,确认无误后单击“部署HPC集群”,提交创建。 提交成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“部署中”了,等待集群创建完成变成“运行中”代表集群部署完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
群。 卸载共享存储 登录HPC-S²控制台。 单击左侧的“共享存储”进入共享存储管理页面。 在“共享存储”页,在左上角选择集群。 在列表中查看当前集群挂载的弹性文件服务,选择待卸载的弹性文件服务,在操作列下单击“卸载”。 单击“确定”,卸载弹性文件服务 父主题: 共享存储
intel/impi/2018.0.128/lib64 执行下列命令,导入环境变量。 # source ~/.bashrc 执行下列命令,查看是否导入成功。 # which mpirun 图2 环境变量导入成功 回显结果如图2所示,表示环境变量导入成功。 执行以下命令,在单个ECS上运行Intel
/lib 执行以下命令,导入配置的MPI环境变量。 # source ~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 # which mpirun 图2 查看社区OpenMPI环境变量 系统回显结果如图2所示,则环境配置正常。 执行以下命令,在单个弹性云服务器上运行Intel
LD_LIBRARY_PATH=/opt/mpich-332/lib 执行下列命令,导入环境变量。 $ source ~/.bashrc 执行下列命令,查看是否导入成功。 $ which mpirun 图2 MPICH环境变量导入成功 回显结果如图2所示,表示环境变量导入成功。 执行以下命令,在单个BMS上运行MPICH。
intel/impi/2018.0.128/lib64 执行下列命令,导入环境变量。 $ source ~/.bashrc 执行下列命令,查看是否导入成功。 $ which mpirun 图2 Intel MPI环境变量导入成功 回显结果如图2所示,表示环境变量导入成功。 执行以下命令,在单个BMS上运行Intel
登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。 # service firewalld stop # iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1