检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
reached”。 处理方法 检查“/etc/ssh/sshd_config”配置文件,确保配置文件中“AuthorizedKeysFile”添加了“/usr/local/.hpccluster/role/.ssh/authorized_keys”配置项。 检查“/usr/local/
调换A、B机器角色,B机器作为Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.
本节指导用户安装和使用社区OpenMPI(以3.1.1版本的OpenMPI为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装HPC-X工具套件。 下载需要的HPC-X工具套件以及OpenMPI。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X 套件,HPC-X 的下载需要
a中获取的pkey $source ~/.bashrc 如果存在多个pkey,使用英文逗号隔开。 执行以下命令,检查环境变量是否配置成功。 # which mpirun 图3 检查环境变量 在单个BMS上运行Platform MPI。 执行以下命令,重新编译hello.c文件。 $ mpicc
MPI_IB_PKEY=步骤2.1中获取的pkey $source ~/.bashrc 如果存在多个pkey,使用英文逗号隔开。 执行以下命令,检查环境变量是否配置成功。 # which mpirun 图3 Platform MPI环境变量导入成功 执行下列命令,在单个ECS上运行Platform
com/networking/hpc-x 将下载的软件包拷贝到BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压HPC-X工具套件,并修改HPC-X工具套件目录。 # tar -xvf hpcx-v2.2.0-gcc-MLNX_OFED_LINUX-4.3-1.0.1.0-redhat7
-mca btl_openib_if_include "mlx5_0:1" -x MXM_IB_USE_GRH=y hostname 图2 检查配置文件 回显如图2所示,显示集群中所有BMS的主机名,则表示hostfile文件配置成功。 在任意一台BMS中执行以下命令,运行MPI
-mca btl_openib_if_include "mlx5_0:1" -x MXM_IB_USE_GRH=y hostname 图3 检查配置文件 回显如图3所示,显示集群中所有BMS的主机名,则表示hostfile文件配置成功。 在任意一台BMS中执行以下命令,运行MPI
下载地址:https://developer.nvidia.com/networking/hpc-x 安装HPC-X工具套件。 将1中下载的HPC-X压缩包上传至运行MPI的弹性云服务器内。 执行以下命令,解压HPC-X工具套件。 $ tar xvf hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4
/usr/mpi/gcc/openmpi-4.0.2a1/bin/mpirun $ rpm -qa | grep mlnx-ofa 图1 检查IB驱动 查看回显结果。 如果回显如图1所示,表示已安装IB驱动,执行步骤3。 如果未安装IB驱动,执行步骤2。 安装IB驱动。 下载安装包“MLNX_OFED_LINUX-4
n:$MANPATH $ unset MPI_REMSH 执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图1 检查MPI环境变量 在单个BMS上通过Spectrum MPI运行可执行文件。 假设hello.c文件在“/home/rhel/”目录下,生成
操作场景 本节指导用户安装和使用IB驱动自带的OpenMPI(以版本3.0.0rc6为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 执行以下命令,切换为root 用户。 $ sudo su 执行以下命令,防止系统超时退出。
已确保Linux云服务器网卡设置为DHCP的方式动态获取网络地址。 已清理Linux云服务器中的udev配置规则。 已安装并配置Cloud-init工具。 已卸载Linux云服务器中挂载的所有数据盘。 控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。 进入弹性云服务器信息页面。
用户基于外部镜像创建的个人镜像,仅用户自己可见。包含操作系统、SDI卡驱动、bms-network-config网络配置程序、cloud-init初始化工具以及用户的私有应用。 选择“私有镜像”,并展开“镜像”的下拉框,选择所需的私有镜像。 共享镜像 您将接受其他用户共享的私有镜像,作为自己的镜像进行使用。
则创建的数据盘ID为“Datadiskid= d3a60e1a-3922-4821-883c-a7b8a19e0856”。 执行以下命令,检查数据盘状态。 cinder show {volumeId} 如果数据盘状态为可用,则可以将其挂载至弹性云服务器上。 执行以下命令,挂载可用的数据盘至弹性云服务器。