检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
名称可自定义,但需符合命名规则。集群名称命名规则如表1所示。 表1 集群名称命名规则 参数 规则 样例 集群名称 集群名称长度范围为1到52位。 只能由英文字母、数字、“-”以及“.”组成 名称不能以“-”、“.”开头和结尾 不能包含连续的“-”和“.”,例如“--”、“..”、“-.”和“.-”
集群云服务器节点创建完成,但在部署过程中失败了能否修复? 将集群删除,不要勾选“删除云服务器”,使用已有节点部署集群的方法重新部署集群。 父主题: 常见问题
停止节点 操作场景 按需付费类型的节点资源暂不使用或出现故障时可停止节点,使资源不再计费。 包周期资源关机后仍继续扣费,需手动退订后可停止扣费。 只有状态为“运行中”的节点可执行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。
启动节点 操作场景 节点关机后,如需再次重启恢复使用,可重新启动节点。 状态为“停止”的节点可进行启动操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要启动的节点,单击操作中“更多 > 启动”。
重启节点 操作场景 当集群中某节点出现异常,可以使用节点重启的功能对该节点进行重启操作尝试恢复。 只有状态为“运行中”的节点可进行重启操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行停止操作的节点,单击操作中“更多
节点删除 操作场景 集群当前的节点数较多,可以选择将部分节点进行删除,对集群进行缩容操作以同时节省费用。 集群中某个节点出现异常且无法手动恢复后,可使用节点删除将该节点进行删除操作,随后根据需要再重新进行集群扩容操作。 操作须知 无论单节点删除或是批量删除,管理节点是禁止删除操作的。
在"创建文件系统"界面的"选择网络"选项中,需注意与购买的弹性云服务器选择相同的网络配置。 4.在"创建文件系统"界面的其他选项中请您根据业务需要,按需填写即可,填写完成后点击购买,完成创建。 图3 完成创建 父主题: 实施步骤
配置节点互信 配置节点互信免密登录 STAR-CCM+集群运行时候需要跨节点运行,推荐使用互信免密登录。 # 生成ssh公钥和私钥 ssh-key-gen # 拷贝公钥到指定主机的~/.ssh/authorized_key文件中 ssh-copy-id root@目标主机IP 例如:ssh-copy-id
查看集群的节点信息 操作场景 集群创建完成后,如需查看集群中节点的详细信息,可进入一站式HPC服务提供的“节点管理”页,查看例如当前集群中节点,包括节点名称和ID、节点类型、状态、规格、IP、共享存储挂载状态、可用区以及付费类型等信息。 操作步骤 前提条件:用户集群的节点列表不为空。
云服务器组。 标签 对弹性云服务器的标识。 可选配置,给弹性云服务器添加标签,方便识别和管理您拥有的弹性云服务器资源。 设置“云服务器名称”。 名称可自定义,但需符合命名规则:只能由中文字符、英文字母、数字及“_”、“-”、“.”组成。 如果同时创建多台弹性云服务器,系统会自动按序增加后缀。
HPC断点续算计算方案 操作场景 在HPC领域很多应用本身是支持断点续算功能的,例如LAMMPS, GROMACS。同时HPC常用的调度软件也对断点续算有集成支持,如PBS、Slurm与LSF等。 本节以LAMMPS为例,介绍如何在HPC进行断点续算。 步骤1 安装FFTW 依次执行以下命令,安装FFTW软件。
查看已有节点部署集群的进度 操作场景 使用已有节点部署集群的命令下发之后,如需查看集群的部署进度,可进入一站式HPC服务提供的“进度”页查看当前集群部署的具体进展和详细信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要查看的集群,单击操
名称可自定义,但需符合命名规则。集群名称命名规则如表3所示。 表3 集群名称命名规则 参数 规则 样例 集群名称 集群名称长度范围为1到52位。 只能由英文字母、数字、“-”以及“.”组成。 名称不能以“-”、“.”开头和结尾。 不能包含连续的“-”和“.”,例如“--”、“..”、“-.”和“
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
概述 操作场景 高性能计算解决方案适用于基因测序,工业仿真等高性能计算场景,您根据实际计算需求购买HPC集群。 本节操作介绍创建HPC集群的方式,以及创建流程,引导您一站式完成集群的创建、配置,并在HPC-S²上完成高性能计算作业。 部署方式简介 购买高性能计算解决方案:根据实际
HPC-S²应用场景与使用限制 HPC-S²应用场景 计算资源创建:HPC-S²支持一键式报价和一键式购买HPC集群,并在创建集群时自动部署所配置的调度器、域控制器以及运行时的依赖。 计算资源配置:HPC-S²支持计算资源的多种配置管理,包括集群管理、节点管理、扩容集群节点及资源状态查看等。
什么是HPC-S² HPC解决方案服务 高性能计算(High-performance computing,简称HPC)是一个计算机集群系统,通过管理节点对计算任务进行分解,交给不同的计算节点进行计算,以此来解决大型计算问题。在科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业均有广泛的应用。
删除集群 操作场景 当集群不再使用后,可使用集群删除的功能将集群删除,如未勾选“删除云服务器”,节点资源将持续扣费,包周期资源需手动退订。 集群创建失败后,可使用集群删除的功能将集群删除,删除时不要勾选“删除云服务器”,然后再使用“已有节点部署集群”的功能重新部署集群。 集群出现