检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。 父主题: 常见问题
HPC简介 什么是HPC 高性能计算(High-performance computing,HPC)是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。 HPC的业务特点 科学研究
HPC和公有云 公有云上部署HPC的优势 传统的HPC使用中存在如下问题: 投资成本高,扩容部署复杂,重复利用已有投资十分困难。 应用复杂,资源预测困难,灵活性差,亟待提升效率。 效率低下导致决策缓慢,失去市场、以及开发研究成果的良机。 应用计算量快速膨胀,对性能要求越来越高。
使用云平台提供的许可证,申请许可证需要支付一定的费用。 使用自带许可证(BYOL) 使用用户已有操作系统的许可证,无需重新申请。 设置“存储”。 根据磁盘使用的存储资源是否独享,磁盘划分为“云硬盘”、“专属存储”和“专属企业存储”三类,您可以根据实际需求进行选择。当前创建时仅支持携一种类型的磁盘下发裸金属服务器。
名称可自定义,但需符合命名规则:只能由中文字符、英文字母、数字及“_”、“-”、“.”组成。 如果同时创建多台弹性云服务器,系统会自动按序增加后缀。 设置您创建弹性云服务器的数量。 设置完成后,您可通过单击“价格计算器”,查询当前配置的费用。 单击“立即申请”。 在确认规格页面,您可以查看规格详情并提交申请。
集群扩容 操作场景 集群使用过程中,如当前的集群规模已经不满足需要,可使用集群扩容功能对集群进行扩容操作以增加节点数。 只有状态为“运行中”的集群可进行扩容操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要扩容的集群,单击后方操作中“扩容”,进入扩容的详情页面。
MPI。 执行以下命令,安装需要的库文件。 # yum install glibc.i686 libgcc-4.8.5-11.el7.i686 增加执行权限,例如安装包所在路径为/root。 # cd /root && chmod +x platform_mpi- 09.01.04.03r-ce
yum install glibc.i686 libgcc-4.8.5-11.el7.i686 libgcc_s.so.1 执行以下命令,增加执行权限。 #chmod +x platform_mpi-09.01.04.03r-ce.bin 安装Platform MPI。 # ./platform_mpi-09
0rc2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动。 执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-3.1.0rc2/bin/mpirun $ rpm
2a1为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动 执行以下命令,查询是否已成功安装IB驱动。 $ ls /usr/mpi/gcc/openmpi-4.0.2a1/bin/mpirun $ rpm
已配置弹性云服务器免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 执行以下命令,切换为root 用户。 $ sudo su 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,查询是否已安装IB驱动。 # rpm -qa
执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录BMS。 $ ssh localhost 图1 免密登录BMS 系统回显结果如图1所示,可以无密钥登录本节点,表示权限配置成功。 依次登录集群中其他BMS,重复执行步骤1~5。 执行以下命令,验证参加测试的BMS之间是否可以免密码互相登录。
执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。其中hostname1为本主机名。 $ ssh localhost $ ssh hostname1 依次登录集群中其他ECS,重复执行步骤1~4。 执行以下命令,验证参加测试的ECS之间是否可以免密码互相登录。 假设集群
BMS场景) 在HPC集群上运行MPI应用(X86 BMS场景) 2018-08-30 第六次正式发布。 增加 HPC断点续算计算方案 2018-07-30 第五次正式发布。 增加 Platform MPI和在HPC集群上运行Platform MPI,弹性云服务器支持使用Platform
方案概述 方案应用 HPC提供了超高浮点计算能力解决方案,可用于解决计算密集型、海量数据处理等业务的计算需求,如科学研究、气象预报、计算模拟、军事研究、CAD/CAE、生物制药、基因测序、图像处理等,缩短需要的大量计算时间,提高计算精度。 方案架构 方案优势 降低TCO 可以按需
登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service
登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service
登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service
登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。 # service firewalld stop # iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1.2~步骤1
登录集群中任意一台BMS。 执行以下命令,关闭BMS防火墙。 # service firewalld stop # iptables -F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。