检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。 # service firewalld stop # iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1
息。 云服务器组 可选配置,云服务器组内的弹性云服务器将遵循反亲和策略,尽量分散地创建在不同主机上。 如果您使用SCSI类型的共享云硬盘作为数据盘,此时,为支持SCSI锁命令,建议您设置待创建弹性云服务器的云服务器组。 标签 对弹性云服务器的标识。 可选配置,给弹性云服务器添加标
方便的对集群、节点、任务以及共享存储进行查看及管理操作,实现集群的一键式开通和部署等功能。 功能 说明 集群管理 HPC-S²的管理控制台提供了HPC-S²集群相关的集群创建、集群进度(包括创建/部署/扩容/缩容等操作)查看、集群详情查看、对集群进行管理(包括扩容、启动、停止、删除等操作)、实例topo管理的功能。
安全组用来实现安全组内和安全组间裸金属服务器的访问控制,加强裸金属服务器的安全保护。用户可以在安全组中定义各种访问规则,当裸金属服务器加入该安全组后,即受到这些访问规则的保护。购买裸金属服务器时,支持选择裸金属服务器所在的安全组。目前,申请一台裸金属服务器时只能选择一个安全组。 说明: 裸金属服务器初始化需要确保安全组出方向规则至少满足如下要求:
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master
登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页上方的集群下拉框切换到要查看的集群,查看该集群的节点列表。 单击节点名称,跳转至对应的ECS列表页即可查看节点详细信息。 父主题: 查看HPC集群
该任务指导用户在已配置好的弹性云服务器上,运行IB驱动自带的MPI应用(3.0.0rc6版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。
该任务指导用户在已配置好的弹性云服务器上,运行社区MPI应用(3.1.1版本)。 前提条件 已成功创建带IB网卡的弹性云服务器,并绑定了弹性IP进行登录。 已使用私有镜像创建多个弹性云服务器。 操作步骤 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。
使用私有镜像创建的弹性云服务器创建成功后,您可以在弹性云服务器列表页查看详情,这些云服务器将被用作HPC集群。 API方式 以创建H2型ECS集群为例: URI POST /v1/{$tenant_id}/cloudservers 请求样例 假设需要批量创建4台弹性云服务器,则修改count值为4,请求样例如下:
in fi 步骤4 提交作业,且运行期间无中断 在不中断作业的情况下,提交作业并运行,查看作业运行时间。 执行以下命令,提交作业。 qsub job.pbs 作业运行结束后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图3所示,可以看到作业一共运行了4分10秒。 图3
0rc6为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 执行以下命令,切换为root 用户。 $ sudo su 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,查询是否已安装IB驱动。
配置单个ECS免密登录 操作场景 该任务指导用户在单个弹性云服务器内执行相关配置,使其可以免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建弹性云服务器,并绑定了弹性IP进行登录。
网IP和挂载的数据盘。未删除的弹性公网IP和数据盘会持续产生扣费。 请不要在ECS控制台对HPC集群中的节点进行操作,以免集群出现异常。 请勿修改或删除“/usr/local/.hpccluster”路径下文件内容,以免造成集群异常。 “/usr/local/.hpccluster/role/
进入弹性云服务器信息页面。 在弹性云服务器列表页,选择待制作镜像的云服务器,确认云服务器为“关机”状态。 如果云服务器为“开机”状态,您可通过单击“操作”列下的“更多 > 关机”将云服务器关机。 单击“操作”列下的“更多 > 制作镜像”,将弹性云服务器制作为私有镜像。 根据界面提示,填写镜像的基本信息。
# source ~/.bashrc 执行以下命令,查看MPI环境变量是否正常。 # which mpirun 图2 查看社区OpenMPI环境变量 系统回显结果如图2所示,则环境配置正常。 执行以下命令,在单个弹性云服务器上运行Intel MPI benchmark。 $ mpirun
弹性云服务器场景支持使用的MPI HPC当前支持的MPI包括: 驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI
创建弹性云服务器 弹性云服务器C6h实例介绍 C6h实例为弹性云服务器下的一款裸金属产品,相比于普通的裸金属产品,C6h实例除了提供标准的以太网卡,还提供了一个支持RoCE协议的网卡,而RoCE协议相比于普通的以太协议最大的优势在于时延极低,特别适合HPC场景低时延业务。 购买弹性云服务器
Intel MPI 操作场景 本节指导用户在ECS上安装和使用Intel MPI应用(以版本l_mpi_2018.0.128为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装Intel MPI。 下载Intel MPI。 下载地址:https://software.intel