检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主要概念 RDMA RoCE 父主题: 附录
在HPC集群上运行MPI应用(鲲鹏BMS场景) 该任务指导以CentOS 7.6的操作系统为例在集群上运行MPI应用。 安装和使用IB驱动自带的Open MPI 安装和使用社区OpenMPI 安装和使用MPICH 父主题: 裸金属服务器场景典型应用
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
在HPC集群上运行MPI应用(X86 BMS场景) 该任务指导以CentOS7.3的OS为例在集群上运行MPI应用。 IB驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 父主题: 裸金属服务器场景典型应用
执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP地址和主机名,例如: 192.168.0.1 ecs-ff-0001 192.168.0.2 ecs-ff-0002
为什么集群被删除后还在计费? 按需购买的集群删除时未勾选“删除云服务器”,因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的E
图2 选择文件系统类型 3.在"创建文件系统"界面的"选择网络"选项中,需注意与购买的弹性云服务器选择相同的网络配置。 4.在"创建文件系统"界面的其他选项中请您根据业务需要,按需填写即可,填写完成后点击购买,完成创建。 图3 完成创建 父主题: 实施步骤
执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa 执行以下命令,查询主机名。 # hostname 执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。
version 7.3及其之后的版本 前提条件 已配置弹性云服务器免密登录。 操作步骤 获取软件包。 获取IBM Spectrum MPI软件包。 下载地址:https://www-01.ibm.com/marketing/iwm/iwm/web/preLogin.do?source=swerpsysz-lsf-3
4~步骤2.6。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。 在ECS中使用以下命令,验证连通性。
d~2.f。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。 在ECS中使用以下命令,验证连通性。
3的HPC-X版本是“hpcx-v2.2.0-gcc-MLNX_OFED_LINUX-4.3-1.0.1.0-redhat7.3-x86_64.tbz”。 下载地址:https://developer.nvidia.com/networking/hpc-x 将下载的软件包拷贝到BMS内(建议在“/home/rhel”目录下)。
弹性云服务器场景支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI
exit 执行以下命令,添加hostfile文件。 # vi hostfile 添加的内容为弹性云服务器的IP地址或者主机名(主机名需要在/etc/hosts中有对应IP地址信息),例如 # cat hostfile 192.168.0.1 192.168.0.2 ... 执行以下
鲲鹏裸金属服务器支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI MPICH 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI(鲲鹏BMS场景)
若以上方法无法解决,请联系技术支持进行处理。 STAR-CCM+启动时,报错“Address is not valid” 问题现象: STAR-CCM+使用启动时报错地址不合法,出现提示"Address is not valid"。 解决方案: 1.请参照STAR-CCM+安装与运行中“运行OpenMPI下
为MPI集群运行程序时的hostlist参数,在集群上通过Spectrum MPI运行可执行文件。其中, IP代表集群中的弹性云服务器IP地址。 Number代表该弹性云服务器的任务数。 假设集群中共有两个弹性云服务器,主机名分别是host-192-168-0-27和host-1
1Eval-rh7_Aug11.x86_64.rpm ibm_smpi-10.01.01.0Eval-rh7_Aug11.x86_64.rpm 下载地址:https://www-01.ibm.com/marketing/iwm/iwm/web/preLogin.do?source=swerpsysz-lsf-3
裸金属服务器场景支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI(X86
如果未安装IB驱动,执行2。 安装IB驱动。 下载安装包“MLNX_OFED_LINUX-4.3-1.0.1.0-rhel7.3-x86_64.tgz”。 下载地址:https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/