检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。 父主题: 常见问题
置文件中“AuthorizedKeysFile”添加了“/usr/local/.hpccluster/role/.ssh/authorized_keys”配置项。 检查“/usr/local/.hpccluster/role/.ssh/”目录下的文件,确保该目录下“authorized_keys”该文件未被删除。
判断系统是否开启超线程。 通过查询系统的物理核数和逻辑核数的关系可以判断是否开启多线程,如果:逻辑核数 = 物理核数,说明没有开超线程;逻辑核数 = 2*物理核数,说明系统开启了多线程。 Linux系统可以通过查询/proc/cpuinfo文件得到和cpu相关的信息,所需要参数解释如下: cat
STAR-CCM+使用OpenMPI启动时,命令中有"-x"和"--mca"导致启动失败 问题现象: STAR-CCM+使用OpenMPI启动时候命令中同时有"-x"和"--mca"会启动失败,OpenMPI不支持"-x"参数和"--mca"同时使用,报错如下图所示。 解决方案: 1
安装和使用IB驱动自带的Open MPI 操作场景 该任务指导用户在鲲鹏BMS集群上运行IB驱动自带的MPI应用(以版本4.0.2a1为例)。 前提条件 已配置BMS集群间互相免密登录。 集群中所有的BMS,均已安装IB驱动自带的OpenMPI。 操作步骤 关闭防火墙。 登录集群中任意一台BMS。
该任务指导用户使用制作的私有镜像创建应用集群,包括管理控制台方式和基于HTTPS请求的API(Application programming interface)方式。 管理控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。 进入弹性云服务器信息页面。 单击“创建弹性云服务器”,开始创建应用集群。
本节指导用户安装和使用社区OpenMPI(以3.1.1版本的OpenMPI为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装HPC-X工具套件。 下载需要的HPC-X工具套件以及OpenMPI。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X 套件,HPC-X
登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如: 192.168.0.1 bms-0004 192.168.0.2 bms-0005 ... 执行以下命令,添加hostfile文件。
下载地址:https://developer.nvidia.com/networking/hpc-x 安装HPC-X工具套件。 将1中下载的HPC-X压缩包上传至运行MPI的弹性云服务器内。 执行以下命令,解压HPC-X工具套件。 $ tar xvf hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4
安装和使用MPI 弹性云服务器场景支持使用的MPI IB驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 父主题: 弹性云服务器场景典型应用
Intel MPI 操作场景 本节指导用户在ECS上安装和使用Intel MPI应用(以版本l_mpi_2018.0.128为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装Intel MPI。 下载Intel MPI。 下载地址:https://software.intel
Platform MPI 操作场景 本节指导用户在ECS上安装和使用Platform MPI应用(以版本platform_mpi-09.01.04.03r-ce为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装Platform MPI。 执行以下命令,安装需要的库文件。
请专属云,再创建裸金属服务器。 了解和申请专属云,请参见《专属云用户指南》。 如果您希望裸金属服务器拥有独享的存储设备,请您在开通专属云后申请专属企业存储,再创建裸金属服务器。 了解和申请专属企业存储,请参见《专属企业存储用户指南》。 操作步骤 登录管理控制台。 选择“计算 > 裸金属服务器”。
执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa 执行以下命令,查询主机名。 # hostname 执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。
安装和使用MPI(X86 BMS场景) 该任务指导以CentOS7.3的OS为例在单节点上运行MPI应用。 裸金属服务器场景支持使用的MPI 安装和使用IB驱动自带的Open MPI 安装和使用社区OpenMPI 安装和使用Spectrum MPI 安装和使用Intel MPI 安装和使用Platform
配置BMS集群互相免密登录 操作场景 该任务指导用户在BMS集群上进行相关设置,并使其可以相互免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建BMS,并绑定了弹性IP进行登录。
执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP地址和主机名,例如: 192.168.0.1 ecs-ff-0001 192.168.0.2 ecs-ff-0002
IB驱动自带的OpenMPI 操作场景 本节指导用户安装和使用IB驱动自带的OpenMPI(以版本3.0.0rc6为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 执行以下命令,切换为root
com/networking/hpc-x 将下载的软件包拷贝到BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压HPC-X工具套件,并修改HPC-X工具套件目录。 # tar -xvf hpcx-v2.2.0-gcc-MLNX_OFED_LINUX-4.3-1.0
安装和使用MPICH 操作场景 本节指导用户在鲲鹏BMS集群上安装和使用MPICH应用(以版本mpich-3.3.2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装MPICH。 下载MPICH。 下载地址:https://aur