检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群使用过程中,如当前的集群规模已经不满足需要,可使用集群扩容功能对集群进行扩容操作以增加节点数。 只有状态为“运行中”的集群可进行扩容操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要扩容的集群,单击后方操作中“扩容”,进入扩容的详情页面。
操作场景 当集群中某节点出现异常,可以使用节点重启的功能对该节点进行重启操作尝试恢复。 只有状态为“运行中”的节点可进行重启操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行停止操作的节点,单击操作中“更多
提供海量、安全、高可靠、低成本的数据存储能力。 华为 >1 以华为云管理控制台显示为准。 9 镜像服务(IMS) 提供镜像(ROCE)的全生命周期管理能力,具有便捷、安全、灵活、统一的优势。 华为 1 以华为云管理控制台显示为准。 仿真软件STAR-CCM+安装在SFS Turbo中,其他软件安装在弹性云服务器中。
节点关机后,如需再次重启恢复使用,可重新启动节点。 状态为“停止”的节点可进行启动操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要启动的节点,单击操作中“更多 > 启动”。 单击“确定”。 提交成功后,返回
操作场景 按需付费类型的节点资源暂不使用或出现故障时可停止节点,使资源不再计费。 包周期资源关机后仍继续扣费,需手动退订后可停止扣费。 只有状态为“运行中”的节点可执行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。
为什么集群被删除后还在计费? 按需购买的集群删除时未勾选“删除云服务器”,因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的EIP资源也不会删除
节点删除(即集群缩容)时,仅在集群状态处于“运行中”或“异常”时方可操作。 节点删除(即集群缩容)时,需要保证集群中其他节点的状态均为“运行中”方可操作。 节点删除(即集群缩容)时,用户需要自行确认所选节点无作业执行,否则会导致正在运行的作业异常。 节点删除时,如果所选节点挂载了数据盘,节
本节指导用户在BMS集群上安装和使用Spectrum MPI应用(以版本10.01.01为例)。 对于集群中的每台BMS,都需要执行该操作。 背景信息 IBM Spectrum MPI v10.1版本当前支持的操作系统列表如下: IBM Spectrum MPI 10.1.0.1 Eval for
启动集群 操作场景 停止状态的集群,如需再次开启集群执行作业,可将集群重新启动。 只有状态为“停止”的集群可进行启动操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要启动的集群,单击后方操作列“更多 > 启动”。 单击“确定”。 在集群
1.1版本为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装HPC-X工具套件。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X 套件,适用于CentOS 7.3的HPC-X版本是“hpcx-v2
停止集群 操作场景 按需类型的集群,如暂时没有任务需要执行,可使用集群停止功能对集群进行管理操作以节省费用。 包周期资源不适用,关机后仍继续扣费,需手动退订后可停止扣费。 有集群状态为“运行中”的集群可进行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集
要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。 父主题: 常见问题
本节指导用户在BMS集群上安装和使用Platform MPI应用(以版本platform_mpi- 09.01.04.03r-ce.bin为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装Platform MPI 下载platformMPI,如:platform_mpi-
安装和使用Intel MPI 操作场景 本节指导用户在BMS集群上安装和使用Intel MPI应用(以版本l_mpi_2018.0.128为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装Intel MPI。 下载Intel MPI。
安装和使用MPICH 操作场景 本节指导用户在鲲鹏BMS集群上安装和使用MPICH应用(以版本mpich-3.3.2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装MPICH。 下载MPICH。 下载地址:https://aur
STAR-CCM+集群运行时候需要跨节点运行,推荐使用互信免密登录。 # 生成ssh公钥和私钥 ssh-key-gen # 拷贝公钥到指定主机的~/.ssh/authorized_key文件中 ssh-copy-id root@目标主机IP 例如:ssh-copy-id root@192.168.0.166
用于在公有云平台上创建高性能计算服务器。 虚拟私有云(VPC) HPC场景下所涉及的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组的相关网络安全隔离。 镜像服务(IMS) 在创建高性能计算的云服务器时,需要使用符合要求的镜像文件。 在制作私有镜像时,需要将已有的高性能计算云服务器创建为私有镜像,从而创建集群使用。
C缓存型"文件系统类型。 图2 选择文件系统类型 3.在"创建文件系统"界面的"选择网络"选项中,需注意与购买的弹性云服务器选择相同的网络配置。 4.在"创建文件系统"界面的其他选项中请您根据业务需要,按需填写即可,填写完成后点击购买,完成创建。 图3 完成创建 父主题: 实施步骤
Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。
environment. MPI_Finalize(); } $ mpicc hello.c -o hello 不同版本的MPI运行的hello文件是不同的,都需要使用命令mpicc hello.c -o hello对hello.c文件重新编译。 执行以下命令,在单个BMS上运行社区OpenMPI。