检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是HPC-S² HPC解决方案服务 高性能计算(High-performance computing,简称HPC)是一个计算机集群系统,通过管理节点对计算任务进行分解,交给不同的计算节点进行计算,以此来解决大型计算问题。在科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业均有广泛的应用。
弹性云服务器设施,并且这些设施是弹性的,可以根据需求伸缩。该任务指导用户如何创建支持IB网卡的弹性云服务器,包括管理控制台方式和基于HTTPS请求的API(Application programming interface)方式。 H2型、HI3型弹性云服务器使用带宽100Gb/
裸金属服务器初始化需要确保安全组出方向规则至少满足如下要求: 协议:TCP 端口范围:80 远端地址:169.254.0.0/16 如果您使用的是默认安全组出方向规则,则已经包括了如上要求,可以正常初始化。默认安全组出方向规则为: 协议:Any 端口范围:Any 远端地址:0.0.0.0/16
够弹性伸缩至320TB规模,具备高可用性和持久性,为海量的小文件、低延迟高IOPS型应用提供有力支持。 使用背景 STAR-CCM+运行需要提供一个集群中所有节点均可读取的算例输入文件,通常做法是将算例文件放到NAS存储中,华为云SFS Turbo提供按需扩展的高性能文件存储,并
RDMA概念 远程直接内存访问(即Remote Direct Memory Access)是一种直接内存访问技术,它将数据直接从一台计算机的内存传输到另一台计算机,无需尤其是面对高性能计算HPC、大数据分析和浪涌型IO高并发、低时延应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求。
HPC解决方案当前采用的是DHCP方式的IPoIB方案,实现IP地址自动化发放和配置。 IPoIB的约束和限制 支持管理一个IB网卡。 继承BMS、H2型、HL1型、HI3型云服务器对IB网卡的使用约束与限制,使用IPoIB特性的弹性云服务器不支持迁移。 继承H2型、HL1型、HI3型云服务器对
对象存储服务(OBS) 是一种基于对象的海量存储服务,为用户提供海量、低成本、高可靠、高安全的数据存储能力。 弹性文件服务(SFS) 为用户的弹性云服务器提供一个完全托管的共享文件存储,符合标准文件协议( NFS ),能够弹性伸缩至PB规模,具备可扩展的性能,为海量数据、高带宽型应用提供有力支持。
HPC断点续算计算方案 操作场景 在HPC领域很多应用本身是支持断点续算功能的,例如LAMMPS, GROMACS。同时HPC常用的调度软件也对断点续算有集成支持,如PBS、Slurm与LSF等。 本节以LAMMPS为例,介绍如何在HPC进行断点续算。 步骤1 安装FFTW 依次执行以下命令,安装FFTW软件。
如果确认信息无误,单击“提交订单”。 使用私有镜像创建的弹性云服务器创建成功后,您可以在弹性云服务器列表页查看详情,这些云服务器将被用作HPC集群。 API方式 以创建H2型ECS集群为例: URI POST /v1/{$tenant_id}/cloudservers 请求样例 假设需要批量创建4台弹性云服务器,则修改count值为4,请求样例如下:
方案概述 方案应用 HPC提供了超高浮点计算能力解决方案,可用于解决计算密集型、海量数据处理等业务的计算需求,如科学研究、气象预报、计算模拟、军事研究、CAD/CAE、生物制药、基因测序、图像处理等,缩短需要的大量计算时间,提高计算精度。 方案架构 方案优势 降低TCO 可以按需
制作私有镜像 操作场景 对于已完成HPC配置的弹性云服务器,您可以将其作为模板制作私有镜像,便于快速创建集群。该任务指导用户怎样将Linux弹性云服务器转化为私有镜像,包括管理控制台方式和基于HTTPS请求的API(Application programming interface)方式。
署集群。 操作须知 删除集群时,集群管理节点所绑定的EIP资源是不会清理的,需要用户手动删除清理,否则会继续扣费。 删除集群时,如果集群当中的节点挂载了数据盘,集群删除且勾选了删除云服务器时,集群节点锁挂在的数据盘是不会删除的,需要用户手动删除清理,否则会继续扣费。 操作步骤 登录HPC-S²控制台。
HPC简介 什么是HPC 高性能计算(High-performance computing,HPC)是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。 HPC的业务特点 科学研究
建议从官方网站获取 1 - 3 通讯库 Ucx:1.6.0 Udapl:2.1.10mlnx 建议从官方网站获取 1 - 4 通用计算增强型弹性云服务器C6h系列 操作系统:CentOS 7.6 规格:c6h.22xlarge.4.physical 华为 >1 以华为云管理控制台显示为准。
Platform MPI 操作场景 本节指导用户在ECS上安装和使用Platform MPI应用(以版本platform_mpi-09.01.04.03r-ce为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 安装Platform MPI。 执行以下命令,安装需要的库文件。
集群中某个节点出现异常且无法手动恢复后,可使用节点删除将该节点进行删除操作,随后根据需要再重新进行集群扩容操作。 操作须知 无论单节点删除或是批量删除,管理节点是禁止删除操作的。 节点删除(即集群缩容)时,仅在集群状态处于“运行中”或“异常”时方可操作。 节点删除(即集群缩容)时,需要保证集群中其他节点的状态均为“运行中”方可操作。
Converged Ethernet (RoCE)是一种网络协议,允许应用通过以太网实现远程内存访问。目前RoCE有两个协议版本,v1和v2。其中RoCE v1是一种链路层协议,允许在同一个广播域下的任意两台主机直接访问。而RoCE v2是一种Internet层协议,即可以实现路由功能
执行以下命令,生成可执行文件,假设在/home/linux目录下生成。 # mpicc hello.c -o spe_hello 不同版本的MPI运行的hello文件是不同的,因此,如果更换了MPI版本,需要重新执行命令# mpicc hello.c -o spe_hello进行编译,生成新的可执行文件。
MPI_Finalize(); } $ mpicc hello.c -o hello 不同版本的MPI运行的hello文件是不同的,都需要使用命令mpicc hello.c -o hello对hello.c文件重新编译。 执行以下命令,在单个BMS上运行社区OpenMPI。