检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
MANPATH=$MPI_ROOT/share/man:$MANPATH unset MPI_REMSH 执行以下命令,查看环境变量导入是否成功。 # which mpirun 图3 查看环境变量 执行以下命令,在单个弹性云服务器上通过Spectrum MPI运行可执行文件。 执行以下命令,编辑文件。 # cd #
in fi 步骤4 提交作业,且运行期间无中断 在不中断作业的情况下,提交作业并运行,查看作业运行时间。 执行以下命令,提交作业。 qsub job.pbs 作业运行结束后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图3所示,可以看到作业一共运行了4分10秒。 图3
执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录BMS。 $ ssh localhost 图1 免密登录BMS 系统回显结果如图1所示,可以无密钥登录本节点,表示权限配置成功。 依次登录集群中其他BMS,重复执行步骤1~5。 执行以下命令,验证参加测试的BMS之间是否可以免密码互相登录。
Turbo 将SFS Turbo挂载到/opt/Siemens目录 mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens nfs vers=3,timeo=600,nolock 0 0"
基于STAR-CCM+部署HPC集群 方案概述 资源和成本规划 STAR-CCM+部署HPC集群流程图 实施步骤 附录 父主题: 弹性云服务器场景最佳实践
执行ulimit -a 命令查看 关闭超线程 系统默认关闭,如果是打开的,需要进行关闭。 判断系统是否开启超线程。 通过查询系统的物理核数和逻辑核数的关系可以判断是否开启多线程,如果:逻辑核数 = 物理核数,说明没有开超线程;逻辑核数 = 2*物理核数,说明系统开启了多线程。 Linux
验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时
在HPC集群上运行Spectrum MPI 在HPC集群上运行Intel MPI 在HPC集群上运行Platform MPI 父主题: 弹性云服务器场景典型应用
企业分支、科研组织机构等跨全球地理位置进行及时协同工作,提高效率。 可以利用公有云的跨地域能力,共享计算资源,海量数据,并能实现云端大数据分析。 优化性能 性能比普通云服务器大幅提升。 通过虚拟化优化(SR-IOV、PCI直通)等,各类测试报告显示:大规模云化HPC性能损耗不大。 约束与限制 MPI和通讯库的
附录 常见问题 主要概念 父主题: 基于STAR-CCM+部署HPC集群
3的OS为例在单节点上运行MPI应用。 裸金属服务器场景支持使用的MPI 安装和使用IB驱动自带的Open MPI 安装和使用社区OpenMPI 安装和使用Spectrum MPI 安装和使用Intel MPI 安装和使用Platform MPI 父主题: 裸金属服务器场景典型应用
实施步骤 创建HPC私有镜像 创建弹性云服务器 配置节点互信 创建SFS Turbo 挂载共享目录 通讯录安装 MPI安装 STAR-CCM+安装与运行 父主题: 基于STAR-CCM+部署HPC集群
LD_LIBRARY_PATH=/opt/mpich-332/lib 执行下列命令,导入环境变量。 $ source ~/.bashrc 执行下列命令,查看是否导入成功。 $ which mpirun 图2 MPICH环境变量导入成功 回显结果如图2所示,表示环境变量导入成功。 执行以下命令,在单个BMS上运行MPICH。
6 虚拟私有云(VPC) 为云服务器等云上资源构建隔离、私密的虚拟网络环境。 华为 1 以华为云管理控制台显示为准。 7 云硬盘(EVS) 为ECS、BMS等计算服务提供持久性块存储的服务。 华为 >1 以华为云管理控制台显示为准。 8 对象存储服务(OBS) 提供海量、安全、高可靠、低成本的数据存储能力。
依次登录集群中所有ECS,重复执行步骤1.1~步骤1.3,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。 # hostname 图2 查看ECS的主机名 依次登录集群中所有ECS,重复执行步骤2.1~步骤2.2,获取所有ECS的主机名。
/openmpi-310/lib 执行以下命令,导入配置的MPI环境变量。 $ source ~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图3 环境变量正常 回显如图3所示表示环境变量正常。 执行以下命令,在单个BMS上运行社区OpenMPI。
已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动 执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-4.0.2a1/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 检查IB驱动 查看回显结果。 如果回显如图
主要概念 RDMA RoCE 父主题: 附录
依次登录集群中所有ECS,重复执行1.a~1.c,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。 # hostname 图2 查看主机名 依次登录集群中所有ECS,重复执行2.a~2.b,获取所有ECS的主机名。 登录集群中任意一台ECS。
6的操作系统为例在集群上运行MPI应用。 安装和使用IB驱动自带的Open MPI 安装和使用社区OpenMPI 安装和使用MPICH 父主题: 裸金属服务器场景典型应用