检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
启动节点 操作场景 节点关机后,如需再次重启恢复使用,可重新启动节点。 状态为“停止”的节点可进行启动操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要启动的节点,单击操作中“更多 > 启动”。
HPC集群,可以在购买时同时指定管理节点配置与计算节点配置。 图1 购买HPC集群 使用已有节点部署HPC集群:在已有节点资源的前提下,指定管理节点与计算节点,完成HPC集群的部署。 图2 使用已有节点资源部署集群 父主题: 快速入门
创建应用集群 操作场景 您可以在几分钟之内,批量创建多台弹性云服务器。该任务指导用户使用制作的私有镜像创建应用集群,包括管理控制台方式和基于HTTPS请求的API(Application programming interface)方式。 管理控制台方式 登录管理控制台。 选择“计算
停止节点 操作场景 按需付费类型的节点资源暂不使用或出现故障时可停止节点,使资源不再计费。 包周期资源关机后仍继续扣费,需手动退订后可停止扣费。 只有状态为“运行中”的节点可执行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。
命令查看 关闭超线程 系统默认关闭,如果是打开的,需要进行关闭。 判断系统是否开启超线程。 通过查询系统的物理核数和逻辑核数的关系可以判断是否开启多线程,如果:逻辑核数 = 物理核数,说明没有开超线程;逻辑核数 = 2*物理核数,说明系统开启了多线程。 Linux系统可以通过查询/pr
制作镜像”,将弹性云服务器制作为私有镜像。 根据界面提示,填写镜像的基本信息。 源:云服务器 弹性云服务器:保持系统默认值 名称:用户自定义镜像名称。 单击“立即申请”。 系统将自动跳转至镜像服务页面,您可以在此页面查看新创建的私有镜像。 API方式 URI POST /v2/cloudimages/action
重启节点 操作场景 当集群中某节点出现异常,可以使用节点重启的功能对该节点进行重启操作尝试恢复。 只有状态为“运行中”的节点可进行重启操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行停止操作的节点,单击操作中“更多
操作场景 集群当前的节点数较多,可以选择将部分节点进行删除,对集群进行缩容操作以同时节省费用。 集群中某个节点出现异常且无法手动恢复后,可使用节点删除将该节点进行删除操作,随后根据需要再重新进行集群扩容操作。 操作须知 无论单节点删除或是批量删除,管理节点是禁止删除操作的。 节点
因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的EIP资源也不会删除,仍然正常计费。如需停止EIP资源计费,请手动删除EIP。
执行mount -a 备注: 192.168.0.15:/ 是从sfs turbo console中获取到的挂载的路径。 第1个1表示备份文件系统,第2个1表示从/分区的顺序开始fsck磁盘检测,0表示不检测,_rnetdev 表示主机无法挂载直接跳过,避免无法挂载主机无法启动。 设置服务开机自启动
但是要保持所有节点一致,并且后面starccm使用platform方式启动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络) 使用 dtest 进行验证: server端(192.168
/usr/mpi/gcc/openmpi-3.1.0rc2/tests/imb/IMB-MPI1 PingPong 图4 集群运行IB驱动自带OpenMPI 系统回显如图4所示,表示集群上运行IB驱动自带的OpenMPI成功。 父主题: 在HPC集群上运行MPI应用(X86 BMS场景)
而RoCE v2是一种Internet层协议,即可以实现路由功能。虽然RoCE协议这些好处都是基于融合以太网的特性,但是RoCE协议也可以使用在传统以太网网络或者非融合以太网络中。 应用场景 网络密集型应用,例如存储或者集群计算等,需要网络支持大带宽和低时延特性。RDMA的优势相
作业运行结束后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图3所示,可以看到作业一共运行了4分10秒。 图3 运行作业不中断 步骤5 提交作业,模拟计算中断,使用断点续算模式完成计算 模拟作业中断情况:提交作业后,通过关机计算节点的方式手动中断作业,查看中断前、后作业运行时间。 执行以下命令,提交作业。