检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RoCE RoCE概念 RDMA over Converged Ethernet (RoCE)是一种网络协议,允许应用通过以太网实现远程内存访问。目前RoCE有两个协议版本,v1和v2。其中RoCE v1是一种链路层协议,允许在同一个广播域下的任意两台主机直接访问。而RoCE v
安装和使用MPICH 操作场景 本节指导用户在鲲鹏BMS集群上安装和使用MPICH应用(以版本mpich-3.3.2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装MPICH。 下载MPICH。 下载地址:https://aur
RoCE网络问题 dtest或rping打流测试网络双向不通问题 问题现象: dtest/rping打流测试网络双向不通问题:A机器作为Server端,B机器作为Client端,dtest/rping测试RoCE网络异常;调换A、B机器角色,B机器作为Server端,A机器作为C
创建HPC私有镜像 前提条件 创建镜像需选择ECS系统盘镜像。 需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。
安装和使用社区OpenMPI 操作场景 本节指导用户在BMS上安装和使用社区OpenMPI(以4.0.2版本为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装OpenMPI。 下载社区OpenMPI,版本号为“openmpi-4
安装和使用社区OpenMPI 操作场景 本节指导用户在BMS上安装和使用社区OpenMPI(以3.1.1版本为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 安装HPC-X工具套件。 使用社区OpenMPI时,需要同时使用Mellanox的HPC-X
STAR-CCM+部署HPC集群流程图 本文档介绍如何通过仿真软件STAR-CCM+部署HPC集群,流程如图1所示。 图1 基于STAR-CCM+部署HPC集群流程图 父主题: 基于STAR-CCM+部署HPC集群
有云内的弹性云服务器通过固定的公网IP地址对外提供访问服务。 您可以根据实际情况选择以下三种方式: 现在购买:自动为每台弹性云服务器分配独享带宽的弹性公网IP,带宽值可以由您设定。 使用已有:为弹性云服务器分配已有弹性公网IP。只为管理节点绑定弹性公网IP。 线路 全动态BGP可
的集群。 可同时在节点列表左侧勾选多个要进行删除操作的节点,单击集群名称左侧的“删除”。 按需类型节点批量删除 选择是否删除云服务器资源,如勾选,连同云服务器一同删除,如不勾选,则只删除节点信息,对应的云服务器节点仍保留,用户可通过弹性云服务器页面查看。 包周期类型节点批量删除 包周期节点需要手动退订。
安装和使用IB驱动自带的Open MPI 操作场景 本节指导用户在BMS上安装和使用IB驱动自带的Open MPI(以版本3.1.0rc2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动。 执行以下命令,查询是否已成功安装IB驱动。
在“集群管理”页面,对于不需要或异常的集群可进行删除操作。 按需类型集群 确定页可选择是否删除云服务器,如勾选,连同云服务器一同删除,如不勾选,则只删除集群信息,对应的云服务器节点仍保留,用户可通过弹性云服务器页面查看。 包周期类型集群 不能选择删除节点,包周期节点资源需手动退订。 混合类型集群删除
启动、停止、重启、删除等管理功能。 共享存储 HPC-S²的管理控制台提供了HPC-S²集群所对应的存储信息,通过弹性文件服务(SFS)为集群中所有节点提供文件共享路径。 任务管理 HPC-S²的管理控制台提供了HPC-S²集群相关的任务队列、动态调度、亲和性调度、负载重组及基于
当前指定区域的ECS节点; 该节点状态为“运行中”。 该节点绑定了弹性IP。 该节点不在当前账号下的其他集群中。 选择“安全组” 安全组为选定的管理节点所使用的安全组策略,如果有多个策略,可根据需要选择。 选择“计算节点” 计算节点的筛选需要满足以下条件: 当前指定区域的ECS节点。 计算节点状态为“运行中”。
computing,HPC)是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。 HPC的业务特点 科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业都涉及高性能计算集群来解决大型计算问题,管理节点对计算
包月”类型,此时集群的付费类型显示为“混合计费”。 包年/包月:用户选购完云服务器配置后,可以根据需要设置购买时长,系统会一次性按照购买价格对账户余额进行扣费。 按需付费:用户选购完云服务器配置后,无需设置购买时长,系统会根据消费时长对账户余额进行扣费。 选择“当前区域”和“可用区”。
查看集群的节点信息 操作场景 集群创建完成后,如需查看集群中节点的详细信息,可进入一站式HPC服务提供的“节点管理”页,查看例如当前集群中节点,包括节点名称和ID、节点类型、状态、规格、IP、共享存储挂载状态、可用区以及付费类型等信息。 操作步骤 前提条件:用户集群的节点列表不为空。
第四次正式发布。 增加 裸金属服务器场景典型应用 2017-12-15 第三次正式发布。 修改 创建支持IB网卡的弹性云服务器 2017-09-30 第二次正式发布。 增加 IPoIB功能简介 Intel MPI 在HPC集群上运行Intel MPI 配置ECS集群互相免密登录 修改 配置单个ECS免密登录
HPC场景下使用的弹性云服务器,均绑定了云硬盘。 裸金属服务器(BMS) 为用户提供专属的物理服务器,提供卓越的计算性能,满足核心应用对高性能及稳定性的需求,结合了传统托管服务器的稳定性与云中资源高度弹性的优势。 对象存储服务(OBS) 是一种基于对象的海量存储服务,为用户提供海量、低成本、高可靠、高安全的数据存储能力。
为什么集群被删除后还在计费? 在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为
HPC-S²与其他服务的关系 服务名称 HPC-S²与其他服务的关系 主要交互功能 弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。