检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“集群管理”页面选择要查看的集群,单击操作列的“进度”进入查看。 在集群的进度详情页面的“部署”页签可查看当前集群的创建的具体进展和详细信息。 父主题: 查看部署进度
如果所在区域不正确,请单击页面左上角的进行切换。 华南 可用区 指在同一地域下,电力、网络隔离的物理区域,可用分区之内内网互通,不同可用分区之间物理隔离。 如果您需要提高应用的高可用性,建议您将云服务器创建在不同的可用分区。 如果您需要较低的网络时延,建议您将弹性云服务器创建在相同的可用区。 az-01 规格
集群扩容 操作场景 集群使用过程中,如当前的集群规模已经不满足需要,可使用集群扩容功能对集群进行扩容操作以增加节点数。 只有状态为“运行中”的集群可进行扩容操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要扩容的集群,单击后方操作中“扩容”,进入扩容的详情页面。
如果所在区域不正确,请单击页面左上角的进行切换。 选择“可用分区”。 可用分区指在同一地域下,电力、网络隔离的物理区域,可用分区之间内网互通,不同可用分区之间物理隔离。如果您需要提高应用的高可用性,建议您将裸金属服务器创建在不同的可用分区。 选择“规格”。 包括CPU、内存、本地磁盘和扩展
在“集群管理”页面选择要查看的集群,单击操作列的“进度”进入查看。 在集群的进度详情页面的“缩容”页签可查看当前集群缩容的具体进展和详细信息。 父主题: 查看部署进度
选择要进行停止操作的节点,单击操作中“更多 > 重启”。 单击“确定”。 提交成功后,返回到节点管理页面,待操作完成,节点状态变为“运行中”。 父主题: 节点管理
弹性云服务器场景支持使用的MPI IB驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI Platform MPI 父主题: 弹性云服务器场景典型应用
检查“/usr/local/.hpccluster/role/.ssh/”目录下的文件,确保该目录下“authorized_keys”该文件未被删除。 父主题: 常见问题
集群云服务器节点创建完成,但在部署过程中失败了能否修复? 将集群删除,不要勾选“删除云服务器”,使用已有节点部署集群的方法重新部署集群。 父主题: 常见问题
BMS场景) 在HPC集群上运行MPI应用(X86 BMS场景) 2018-08-30 第六次正式发布。 增加 HPC断点续算计算方案 2018-07-30 第五次正式发布。 增加 Platform MPI和在HPC集群上运行Platform MPI,弹性云服务器支持使用Platform
MPI运行可执行文件。 $ mpirun -np 2 /home/rhel/hello 图2 单BMS上运行Spectrum MPI成功 父主题: 安装和使用MPI(X86 BMS场景)
第1个1表示备份文件系统,第2个1表示从/分区的顺序开始fsck磁盘检测,0表示不检测,_rnetdev 表示主机无法挂载直接跳过,避免无法挂载主机无法启动。 设置服务开机自启动 systemctl enable rpcbind systemctl enable nfs 父主题: 实施步骤
图解HPC解决方案 父主题: 简介
MPI。 执行以下命令,安装需要的库文件。 # yum install glibc.i686 libgcc-4.8.5-11.el7.i686 增加执行权限,例如安装包所在路径为/root。 # cd /root && chmod +x platform_mpi- 09.01.04.03r-ce
假设集群中有2个弹性云服务器,另一个云服务器的主机名为hostname2,则命令行为: $ ssh 用户名@SERVER_IP $ ssh hostname2 父主题: 弹性云服务器场景典型应用
驱动自带的OpenMPI 社区OpenMPI MPICH 以下小节的内容详细介绍了MPI的安装与使用,您可以根据需要选择合适的MPI进行安装。 父主题: 安装和使用MPI(鲲鹏BMS场景)
码登录ECS。 假设本主机的主机名为hostname1,则命令行如下: $ ssh localhost $ ssh hostname1 父主题: 弹性云服务器场景典型应用
yum install glibc.i686 libgcc-4.8.5-11.el7.i686 libgcc_s.so.1 执行以下命令,增加执行权限。 #chmod +x platform_mpi-09.01.04.03r-ce.bin 安装Platform MPI。 # ./platform_mpi-09
conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。 父主题: 常见问题
在“集群管理”页面选择要停止的集群,单击操作列“更多 > 停止”。 单击“确定”。 在集群管理页面,待操作正常完成,集群状态变为“停止”。 父主题: 集群管理