检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用HPC-S²服务,用户无需自建机房,无需顾虑硬件升级换代,可随时从虚拟资源池中获取并独享资源,并根据业务变化弹性扩展或收缩。 使用HPC-S²能够为用户自动化配置集群免密、网络信息服务(Network Information Service,NIS)以及集群调度器。
IPoIB设备的硬件地址只能通过ip命令查询,ifconfig查询不到完整地址。静态IP地址配置举例如下: 图1 静态IP地址配置 DHCP动态配置: 标准的DHCP帧格式包括了硬件类型(htype)、硬件地址长度( hlen)、 硬件地址(chaddr)等字段。
前提条件 已确保Linux云服务器网卡设置为DHCP的方式动态获取网络地址。 已清理Linux云服务器中的udev配置规则。 已安装并配置Cloud-init工具。 已卸载Linux云服务器中挂载的所有数据盘。 控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。
HPC-S²使用限制 HPC解决方案服务当前只支持“华北-北京一”、“华北-北京四”、“华南-广州”区域,推荐使用“华北-北京四”,其他区域暂不支持。 集群部署仅支持slurm和sge两种调度器。 集群部署支持鲲鹏架构的sge调度器,支持X86架构的slurm和sge调度器。
下载地址:https://aur.archlinux.org/packages/mpich/ 执行以下命令,解压并安装MPICH。 以mpich-3.3.2.tar.gz为例: # tar -xvf mpich-3.3.2.tar.gz # cd mpich-3.3.2/ # .
弹性IP 弹性IP是指将公网IP地址和路由网络中关联的裸金属服务器绑定,以实现VPC内的业务资源通过固定的公网IP地址对外提供访问服务。
下载地址:https://software.intel.com/en-us/intel-mpi-library 执行以下命令,解压并安装Intel MPI。
下载地址:https://download.open-mpi.org/release/open-mpi/v4.0/openmpi-4.0.2.tar.bz2 将下载的OpenMPI压缩包拷贝至BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压软件包。
下载地址:https://software.intel.com/en-us/intel-mpi-library 执行以下命令,解压并安装Intel MPI。
- 弹性公网IP 弹性公网IP是指将公网IP地址和路由网络中关联的弹性云服务器绑定,以实现虚拟私有云内的弹性云服务器通过固定的公网IP地址对外提供访问服务。
# TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP地址和主机名,例如: 192.168.0.1 ecs-ff-0001 192.168.0.2 ecs-ff-0002 ..
下载地址:https://www.open-mpi.org/software/ompi/v3.1/ 将下载的OpenMPI压缩包拷贝至BMS内(建议在“/home/rhel”目录下)。 执行以下命令,解压软件包。
配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。
下载地址:https://www-01.ibm.com/marketing/iwm/iwm/web/preLogin.do?
# hostname 执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。
STAR-CCM+启动时,报错“Address is not valid” 问题现象: STAR-CCM+使用启动时报错地址不合法,出现提示"Address is not valid"。
其中, IP代表集群中的弹性云服务器IP地址。 Number代表该弹性云服务器的任务数。
配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。
# vi hostfile 添加的内容为弹性云服务器的IP地址或者主机名(主机名需要在/etc/hosts中有对应IP地址信息),例如 # cat hostfile 192.168.0.1 192.168.0.2 ... 执行以下命令,在集群中运行hostname命令。
下载地址:https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/ 图2 IB驱动的下载页面 执行以下命令,安装软件包。