检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
指使用密钥对作为登录裸金属服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“查看密钥对”创建新的密钥。 如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录裸金属服务器。 密码 指使用设置初始密码方式作为裸金属服务器的鉴权方式,此时,您可以通过用户名密码方式登录裸
yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时 有业务时 父主题: 实施步骤
Platform MPI成功安装 配置环境变量。 执行以下命令,获取pkey。 # cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v 0000 图2 获取pkey 普通用户下,在~/.bashrc中添加: export
id_rsa 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录BMS。 $ ssh localhost 图1 免密登录BMS 系统回显结果如图1所示,可以无密钥登录本节点,表示权限配置成功。 依次登录集群中其他BMS,重复执行步骤1~5。 执行以下命令,验证参加测试的BMS之间是否可以免密码互相登录。
$ source ~/.bashrc 执行下列命令,查看是否导入成功。 $ which mpirun 图2 MPICH环境变量导入成功 回显结果如图2所示,表示环境变量导入成功。 执行以下命令,在单个BMS上运行MPICH。 执行以下命令,生成可执行文件。 $ mpicc hello
创建HPC私有镜像 前提条件 创建镜像需选择ECS系统盘镜像。 需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。
Encrypted:表示云硬盘已加密。 Create Xrole:用于授权EVS访问KMS获取KMS密钥。授权成功后,无需再次授权。 密钥名称:该加密云硬盘使用的密钥名称,默认为evs/default。 Xrole名称:EVSAccessKMS:表示已授权EVS获取KMS密钥,用于加解密云硬盘。 密钥ID:该加密数据盘使用的密钥的ID。
图1 Platform MPI安装成功 默认安装路径为/opt/ibm/platform_mpi。 配置MPI环境变量。 执行以下命令,获取pkey。 # cat /sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v 0000
/usr/mpi/gcc/openmpi-3.1.0rc2/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 确认已安装IB驱动 查看回显结果。 如果回显如图1所示,表示已安装IB驱动,执行3。 如果未安装IB驱动,执行2。 安装IB驱动。 下载安装包“MLNX_OFED_LINUX-4
0 0" >> /etc/fstab 执行mount -a 备注: 192.168.0.15:/ 是从sfs turbo console中获取到的挂载的路径。 第1个1表示备份文件系统,第2个1表示从/分区的顺序开始fsck磁盘检测,0表示不检测,_rnetdev 表示主机无法挂载直接跳过,避免无法挂载主机无法启动。
指使用密钥对作为弹性云服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“查看密钥对”创建新的密钥。 如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录弹性云服务器。 密码 指使用设置初始密码方式作为弹性云服务器的鉴权方式,此时,您可以通过用户名密码方式登录弹性云服务器。
source ~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 # which mpirun 图2 查看MPI环境变量 系统回显结果如图2所示,则环境配置正常。 执行以下命令,在单个弹性云服务器上运行Intel MPI benchmark。 # mpirun --allow-run-as-root
~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 # which mpirun 图2 查看社区OpenMPI环境变量 系统回显结果如图2所示,则环境配置正常。 执行以下命令,在单个弹性云服务器上运行Intel MPI benchmark。 $ mpirun --allow-run-as-root
登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1.b~2.b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如:
登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1.b~2.b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如:
登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1.b~2.b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如:
登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1.b~2.b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如:
了应用将流分成不同消息/事务的需要。 分散/收集条目支持: RDMA支持本地处理多个分散/收集条目,即读取多个内存缓冲区并将其作为一个流或获取一个流并将其写入多个内存缓冲区。 RDMA实现 常见的RDMA实现包括虚拟接口架构、基于融合以太网的RDMA(RoCE)、]InfiniB
登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。 # hostname 图2 查看主机名 依次登录集群中所有ECS,重复执行2.a~2.b,获取所有ECS的主机名。 登录集群中任意一台ECS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP和主机名,例如:
执行以下命令,查看ECS的主机名。 # hostname 图2 查看ECS的主机名 依次登录集群中所有ECS,重复执行步骤2.1~步骤2.2,获取所有ECS的主机名。 登录集群中任意一台ECS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP和主机名,例如: