检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
HPC解决方案服务的管理控制台提供了弹性文件服务SFS的自定义挂载和卸载的功能。集群创建完成后,您可以在共享存储页面为集群挂载/卸载弹性文件服务。通过弹性文件服务SFS为集群提供共享存储的功能。 当集群为运行状态时,您可以选择挂载/卸载弹性文件服务。当集群在创建中或部署状态时,不支持挂载/卸载共享文件服务。 挂载共享存储
ssh/authorized_key文件中 ssh-copy-id root@目标主机IP 例如:ssh-copy-id root@192.168.0.166 配置ssh第一次登录免输入yes 在~/.ssh/config文件中加入如下内容: StrictHostKeyChecking no
在单个BMS上通过MPICH运行可执行文件。 $ mpirun -np 2 -hostfile /home/rhel/hostfile /home/rhel/hello 图2 集群上运行MPICH成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。
trum MPI运行可执行文件。 $ mpirun -np 2 -pernode --hostfile hostfile /home/rhel/hello 图3 集群上运行Spetrum MPI成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。
/etc/hosts 添加的内容为集群中所有ECS的私网IP和主机名,例如: 192.168.0.1 host-192-168-0-1 192.168.0.2 host-192-168-0-2 ... 执行以下命令,添加hostfile文件。 # vi hostfile 添加集群中所有ECS的主机名,例如:
-np 2 --pernode -hostfile hostfile /home/rhel/hello 图3 集群上运行社区OpenMPI成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 父主题: 在HPC集群上运行MPI应用(X86
mpirun -perhost 2 -np 12 -machinefile hostfile /home/rhel/hello 图3 BMS集群上运行Intel MPI成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。
在任意一台BMS中执行以下命令,检验hostfile文件是否配置成功。 $ mpirun -np 2 -pernode --hostfile hostfile -mca btl_openib_if_include "mlx5_0:1" -x MXM_IB_USE_GRH=y hostname 图2 检查配置文件
vi /etc/hosts 添加的内容为集群中所有ECS的私网IP和主机名,例如: 192.168.0.1 host-192-168-0-1 192.168.0.2 host-192-168-0-2 ... 执行以下命令,添加hostfile文件。 $vi hostfile 添加集群中所有ECS的主机名,例如:
-np 12 -machinefile hostfile /home/rhel/hello 图3 BMS集群上Platform MPI运行成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 父主题: 在HPC集群上运行MPI应用(X86
在任意一台BMS中执行以下命令,检验hostfile文件是否配置成功。 $ mpirun -np 2 -pernode --hostfile hostfile -mca btl_openib_if_include "mlx5_0:1" -x MXM_IB_USE_GRH=y hostname 图3 检查配置文件
-np 2 --pernode -hostfile hostfile /home/rhel/hello 图2 集群上运行社区OpenMPI成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 父主题: 在HPC集群上运行MPI应用(鲲鹏BMS场景)
/root/spe_hello 图1 在集群上通过Spectrum MPI运行可执行文件 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 父主题: 在HPC集群上运行MPI应用
g”配置文件,确保配置文件中“AuthorizedKeysFile”添加了“/usr/local/.hpccluster/role/.ssh/authorized_keys”配置项。 检查“/usr/local/.hpccluster/role/.ssh/”目录下的文件,确保该目
执行以下命令,防止系统超时退出。 # TMOUT=0 将ECS对应的密钥文件(.pem文件,假设为*.pem)拷贝至.ssh目录下,命名为“id_rsa”。 $ cd ~/.ssh $ mv *.pem id_rsa 执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa
执行以下命令,给参与测试的弹性云服务器配置主机名。 # hostnamectl set-hostname vm1 执行以下命令,添加“/etc/hosts”文件。 # vi /etc/hosts 添加的内容为弹性云服务器的主机名及IP地址,例如 #cat /etc/hosts 192.168.1.3 vm1
器作为Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。
执行以下命令,在集群中运行hostname命令。 # mpirun --allow-run-as-root -np <hostfile_node_number> -pernode --hostfile hostfile hostname 图1 在集群中运行hostname命令 修改hostfile,运行MPI
在华为云控制台搜索“弹性文件服务 SFS”,并在弹性文件服务页面右上角选择“创建文件系统”。 图1 创建文件系统 2.在"创建文件系统"界面的"文件系统类型"选项中,根据业务需要,选择"HPC型"或"HPC缓存型"文件系统类型。 图2 选择文件系统类型 3.在"创建文件系统"界面的"选择
执行以下命令,防止系统超时退出。 # TMOUT=0 将BMS对应的密钥文件(.pem文件)拷贝至.ssh目录下,命名为“id_rsa”。 $ cd ~/.ssh $ mv *.pem id_rsa 执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa 执行