检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您可以选择使用加密镜像,更多关于加密镜像的信息,请参见《镜像服务用户指南》。 共享镜像 用户将接受公有云其他用户共享的私有镜像,作为自己的镜像进行使用。 选择“共享镜像”,并展开下拉框,选择所需的共享镜像。 市场镜像 提供预装操作系统、应用环境和各类软件的优质第三方镜像。无需配置
在镜像模板中预制MPI库、编译库及优化配置,加快环境部署。 企业分支、科研组织机构等跨全球地理位置进行及时协同工作,提高效率。 可以利用公有云的跨地域能力,共享计算资源,海量数据,并能实现云端大数据分析。 优化性能 性能比普通云服务器大幅提升。 通过虚拟化优化(SR-IOV、PCI直通)等,各类测试报告显示:大规模云化HPC性能损耗不大。
HPC-S²应用场景与使用限制 HPC-S²应用场景 计算资源创建:HPC-S²支持一键式报价和一键式购买HPC集群,并在创建集群时自动部署所配置的调度器、域控制器以及运行时的依赖。 计算资源配置:HPC-S²支持计算资源的多种配置管理,包括集群管理、节点管理、扩容集群节点及资源状态查看等。 HPC-S²使用限制
g”配置文件,确保配置文件中“AuthorizedKeysFile”添加了“/usr/local/.hpccluster/role/.ssh/authorized_keys”配置项。 检查“/usr/local/.hpccluster/role/.ssh/”目录下的文件,确保该目
1/ 将下载的OpenMPI压缩包拷贝至BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压软件包。 # tar -xzvf openmpi-3.1.0.tar.gz # cd openmpi-3.1.0 执行以下命令,安装所需要的库文件,安装之前请确保BMS能与外网连通。
务器,可以节省您重复配置弹性云服务器的时间。 您可以选择使用加密镜像,更多关于加密镜像的信息,请参见《镜像服务用户指南》。 共享镜像 您将接受其他用户共享的私有镜像,作为自己的镜像进行使用。 市场镜像 提供预装操作系统、应用环境和各类软件的优质第三方镜像。 选择“登录方式”。 登
除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的EIP资源也不会删除,仍然正常计费。如需停止EIP资源计费,请手动删除EIP。 集群
MPI运行可执行文件。 假设hello.c文件在“/home/rhel/”目录下,生成的可执行文件名为hello,执行以下命令: $ cd /home/rhel/ $ mpicc hello.c -o hello 执行以下命令,在单个BMS上通过Spectrum MPI运行可执行文件。 $
安装Platform MPI 下载platformMPI,如:platform_mpi- 09.01.04.03r-ce.bin。 执行以下命令,安装依赖包。 # yum install glibc.i686 libgcc-4.8.5-11.el7.i686 libgcc_s.so.1 执行以下命令,增加执行权限。
/mlnxofedinstall 安装配置ucx。 下载ucx安装包 # cd /opt && wget https://github.com/openucx/ucx/releases/download/v1.6.0/ucx-1.6.0.tar.gz 解压ucx包 # tar -xvf ucx-1.6.0
配置lammps 算例输入文件。 以melt为例,生成一个算例melt.in文件。设置每迭代100步生成一个checkpoint文件,假定该文件存放在共享目录“/share”中。内容如下: # 3d Lennard-Jones melt units lj atom_style
hostfile /home/rhel/hello 图2 集群上运行社区OpenMPI成功 hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 父主题: 在HPC集群上运行MPI应用(鲲鹏BMS场景)
确认关闭防火墙成功 依次登录集群中所有BMS,重复执行步骤1.2~步骤1.3,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS, 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如: 192.168
-machinefile hostfile /root/platform_hello hostfile文件在运行时需要指定路径,可执行文件hello路径需为绝对路径,集群中所有可执行文件在同一路径下。 图3 集群上运行Platform MPI成功 父主题: 在HPC集群上运行MPI应用
创建弹性云服务器 弹性云服务器C6h实例介绍 C6h实例为弹性云服务器下的一款裸金属产品,相比于普通的裸金属产品,C6h实例除了提供标准的以太网卡,还提供了一个支持RoCE协议的网卡,而RoCE协议相比于普通的以太协议最大的优势在于时延极低,特别适合HPC场景低时延业务。 购买弹性云服务器
c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1.b~2.b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi
执行以下命令,防止系统超时退出。 # TMOUT=0 将ECS对应的密钥文件(.pem文件,假设为*.pem)拷贝至.ssh目录下,命名为“id_rsa”。 $ cd ~/.ssh $ mv *.pem id_rsa 执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa
将下载的OpenMPI压缩包(以openmpi-3.1.1.tar.gz为例)拷贝至弹性云服务器内,并执行以下命令进行解压。 # tar -xzvf openmpi-3.1.1.tar.gz # cd openmpi-3.1.1 执行以下命令,安装需要的库文件。 # yum install
停止集群 操作场景 按需类型的集群,如暂时没有任务需要执行,可使用集群停止功能对集群进行管理操作以节省费用。 包周期资源不适用,关机后仍继续扣费,需手动退订后可停止扣费。 有集群状态为“运行中”的集群可进行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。
执行以下命令,添加“/etc/hosts”文件。 # vi /etc/hosts 添加的内容为弹性云服务器的主机名及IP地址,例如 #cat /etc/hosts 192.168.1.3 vm1 192.168.1.4 vm2 ... 执行以下命令,添加hostfile文件。 # vi hostfile