检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
集群创建提交失败,提示集群配额不足怎么办? 每个用户只能创建最多3个集群,当集群数量达到上限后会提示该错误,如需创建新集群,可先将不使用或者异常状态的集群进行删除,然后再重新创建集群。 父主题: 常见问题
在HPC集群上运行IB驱动自带的OpenMPI 操作场景 该任务指导用户在已配置好的弹性云服务器上,运行IB驱动自带的MPI应用(3.0.0rc6版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使
EIP quota”怎么办? 问题描述 集群创建任务提交失败,提示“Insufficient EIP quota”。 处理方法 您可以选择以下任一处理方法: EIP配额不足,创建集群时“弹性公网IP”可选择“使用已有”项。 EIP配额不足还可提工单申请扩大弹性公网IP的配额。 父主题:
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。
在HPC集群上运行社区OpenMPI 操作场景 该任务指导用户在已配置好的弹性云服务器上,运行社区MPI应用(3.1.1版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使用“PuTTY”,采用密钥对方式登录弹性云服务器。
常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 选择“公共镜像”,并展开下拉框,选择所需的公共镜像。 私有镜像 用户基于弹性云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。
nd-drivers/linux/mlnx_ofed/,选择相应版本的InfiniBand网卡驱动下载,并根据Mellanox提供的操作指导进行安装。 以操作系统CentOS 7.3为例,推荐安装4.2.1版本的安装包,下载安装包“MLNX_OFED_LINUX-4.2-1.2.0
数的关键应用会采用IPoIB方式通信。 无修改:指运行在IP协议上的应用不需要作任何修改,即可适配IB网络运行。 IPoIB的通信模式有哪些 IPoIB设备能够配置为datagram和connected两种模式,前者提供不可靠的、无连接的链路,后者提供可靠的、有连接的链路。 在datagram模式下,queue
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master
} $ mpicc hello.c -o hello 不同版本的MPI运行的hello文件是不同的,都需要使用命令mpicc hello.c -o hello对hello.c文件重新编译。 执行以下命令,在单个BMS上运行社区OpenMPI。 $ mpirun -np 2 /home/rhel/hello
} $ mpicc hello.c -o hello 不同版本的MPI运行的hello文件是不同的,都需要使用命令mpicc hello.c -o hello对hello.c文件重新编译。 执行以下命令,在单个BMS上运行社区OpenMPI。 $ mpirun -np 2 /home/rhel/hello
gids:查下设备名和index。 UCX_NET_DEVICES: hiroce gids查到的有ip值一行的ib_dev的值: port的值。 UCX_IB_GID_INDEX:hiroce gids查到的有ip值一行的idx的值。 2.若以上方法无法解决,请联系技术支持进行处理。 STAR-CCM+启动时,报错“udapl
本节指导用户安装和使用社区OpenMPI(以3.1.1版本的OpenMPI为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装HPC-X工具套件。 下载需要的HPC-X工具套件以及OpenMPI。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X 套件,HPC-X 的下载需要参考弹性云服
此时,pbs作业回到queued状态,等待可用的计算资源。 开机2中关闭的计算节点,提供可用的计算资源。 此时,pbs作业会继续进行。 作业执行完成后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图5所示,作业运行了3分03秒。由此可以看出,作业是从断点的位置进行续算的。 图5 中断后运行作业信息
3eval_170901-rh7_Apr11.x86_64.rpm 下载需要的HPC-X工具套件。 IBM MPI在EDR SR-IOV场景下的运行需要HPC-X提供的MXM库的支持,HPC-X 的下载需要参考弹性云服务器操作系统的版本以及IB驱动版本,例如,下载的HPC-X版本为:hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4
单击“创建弹性云服务器”,开始创建应用集群。 按照界面提示,填写弹性云服务器的参数配置,详细操作请参见创建支持IB网卡的弹性云服务器。其中, 规格:需与转化的私有镜像的云服务器规格保持一致。 镜像:选择“私有镜像”,然后选择制作私有镜像中制作的私有镜像。 虚拟私有云:集群中的所有弹性云服务器需在同一VPC、同一子网内。
该节点不在当前账号下的其他集群中。 选择“安全组” 安全组为选定的管理节点所使用的安全组策略,如果有多个策略,可根据需要选择。 选择“计算节点” 计算节点的筛选需要满足以下条件: 当前指定区域的ECS节点。 计算节点状态为“运行中”。 计算节点与管理节点为相同的CPU架构。 计算节
使计算机的结构更加简单合理地提高运行速度,相对于X86 CPU架构具有更加均衡的性能功耗比。鲲鹏的优势是高密度低功耗,可以提供更高的性价比。 选择“管理节点配置”。 规格:公有云提供了多种类型的弹性云服务器供您选择,单击下拉框查看支持的云服务器规格。 系统盘:根据所需要的选择磁盘类型和大小。