检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在HPC集群上运行MPI应用(X86 BMS场景) 该任务指导以CentOS7.3的OS为例在集群上运行MPI应用。 IB驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 父主题: 裸金属服务器场景典型应用
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
创建HPC私有镜像 前提条件 创建镜像需选择ECS系统盘镜像。 需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。
安装和使用MPICH 操作场景 本节指导用户在鲲鹏BMS集群上安装和使用MPICH应用(以版本mpich-3.3.2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装MPICH。 下载MPICH。 下载地址:https://aur
STAR-CCM+部署HPC集群流程图 本文档介绍如何通过仿真软件STAR-CCM+部署HPC集群,流程如图1所示。 图1 基于STAR-CCM+部署HPC集群流程图 父主题: 基于STAR-CCM+部署HPC集群
gids:查下设备名和index。 UCX_NET_DEVICES: hiroce gids查到的有ip值一行的ib_dev的值: port的值。 UCX_IB_GID_INDEX:hiroce gids查到的有ip值一行的idx的值。 2.若以上方法无法解决,请联系技术支持进行处理。 STAR-CCM+启动时,报错“udapl
environment. MPI_Finalize(); } $ mpicc hello.c -o hello 不同版本的MPI运行的hello文件是不同的,都需要使用命令mpicc hello.c -o hello对hello.c文件重新编译。 执行以下命令,在单个BMS上运行社区OpenMPI。
B机器作为Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。
1.1版本为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装HPC-X工具套件。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X 套件,适用于CentOS 7.3的HPC-X版本是“hpcx-v2
集群出现异常后,如无法手动进行恢复,可使用集群删除的功能将集群删除,删除时不要勾选“删除云服务器”,然后再使用“已有节点部署集群”的功能重新部署集群。 操作须知 删除集群时,集群管理节点所绑定的EIP资源是不会清理的,需要用户手动删除清理,否则会继续扣费。 删除集群时,如果集群当中的节点挂载了数据盘,集群删
ICMP协议:用于ping云服务器之间的通信情况。 22端口:用于Linux云服务器的SSH方式登录。 3389端口:用于Windows云服务器的远程桌面登录。 网卡 在下拉列表中选择可用的子网。 弹性公网IP 弹性公网IP是指将公网IP地址和路由网络中关联的弹性云服务器绑定,以实现虚拟私
前提条件:用户集群的节点列表不为空。 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页上方的集群下拉框切换到要查看的集群,查看该集群的节点列表。 单击节点名称,跳转至对应的ECS列表页即可查看节点详细信息。 父主题: 查看HPC集群
HPC-S²与其他服务的关系 服务名称 HPC-S²与其他服务的关系 主要交互功能 弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。
指使用密钥对作为弹性云服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“查看密钥对”创建新的密钥。 如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录弹性云服务器。 密码 指使用设置初始密码方式作为弹性云服务器的鉴权方式,此时,您可以通过用户名密码方式登录弹性云服务器。
第四次正式发布。 增加 裸金属服务器场景典型应用 2017-12-15 第三次正式发布。 修改 创建支持IB网卡的弹性云服务器 2017-09-30 第二次正式发布。 增加 IPoIB功能简介 Intel MPI 在HPC集群上运行Intel MPI 配置ECS集群互相免密登录 修改 配置单个ECS免密登录
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master
登录HPC-S²控制台。 单击左侧的“节点管理”; 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行删除操作的节点,单击操作列“删除”。 按需类型节点删除 选择是否删除云服务器,如勾选,连同云服务器一同删除,如不勾选,则只删除节点信息,对应的云服务器节点仍保留,用户可通过弹性云服务器页面查看。
未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。 父主题: 常见问题
云硬盘(EVS) HPC场景下使用的弹性云服务器,均绑定了云硬盘。 裸金属服务器(BMS) 为用户提供专属的物理服务器,提供卓越的计算性能,满足核心应用对高性能及稳定性的需求,结合了传统托管服务器的稳定性与云中资源高度弹性的优势。 对象存储服务(OBS) 是一种基于对象的海量存储服务,为用户提