检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
277a9fdaf9 图4 创建EIP响应样例 查看规格列表。 Client方式 执行以下命令,查看规格列表。 nova flavor-list 图5 查看规格列表 nova flavor-list | grep h2 图6 查看H2型规格列表 Curl命令方式 URI GET
核对当前配置,确认无误后单击“部署HPC集群”,提交创建。 提交成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“部署中”了,等待集群创建完成变成“运行中”代表集群部署完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
磁盘包括系统盘和数据盘。您可以为裸金属服务器添加多块数据盘,系统盘大小可以根据需要自定义。 Windows裸金属服务器暂不支持挂载磁盘。 系统盘 如果选择支持快速发放的规格,界面会提供系统盘配置项,可以根据需要设置磁盘类型和大小。 数据盘 您可以为裸金属服务器添加多块数据盘,并设置数据盘的共享功能。
节点删除(即集群缩容)时,用户需要自行确认所选节点无作业执行,否则会导致正在运行的作业异常。 节点删除时,如果所选节点挂载了数据盘,节点删除时不会删除数据盘,需要用户手动删除清理,否则会继续扣费。 单节点删除操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”; 在“节点管
挂载共享目录 安装软件 yum install nfs-utils 挂载SFS Turbo 将SFS Turbo挂载到/opt/Siemens目录 mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens
若集群创建时选择了密钥方式,扩容则只支持密钥方式。 密钥对 指使用密钥对作为弹性云服务器的鉴权方式。您可以选择使用已有的密钥,或者单击“查看密钥对”创建新的密钥。 如果选择使用已有的密钥,请确保您已在本地获取该文件,否则,将影响您正常登录弹性云服务器。 密码 指使用设置初始密码
根据界面提示,填写镜像的基本信息。 源:云服务器 弹性云服务器:保持系统默认值 名称:用户自定义镜像名称。 单击“立即申请”。 系统将自动跳转至镜像服务页面,您可以在此页面查看新创建的私有镜像。 API方式 URI POST /v2/cloudimages/action 请求样例 POST /v2/cloudimages/action
MANPATH=$MPI_ROOT/share/man:$MANPATH unset MPI_REMSH 执行以下命令,查看环境变量导入是否成功。 # which mpirun 图3 查看环境变量 执行以下命令,在单个弹性云服务器上通过Spectrum MPI运行可执行文件。 执行以下命令,编辑文件。
export MANPATH=$MPI_ROOT/share/man:$MANPATH $ unset MPI_REMSH 执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图1 检查MPI环境变量 在单个BMS上通过Spectrum MPI运行可执行文件。
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。 系统进入“服务配额”页面。 图1 我的配额 您可以在“服务配额”页面,查看各项资源的总配额及使用情况。 如果当前配额不
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 关闭防火墙成功 依次登录集群中所有ECS,重复执行步骤1.1~步骤1.3,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
in fi 步骤4 提交作业,且运行期间无中断 在不中断作业的情况下,提交作业并运行,查看作业运行时间。 执行以下命令,提交作业。 qsub job.pbs 作业运行结束后,执行以下命令,查看作业信息。 qstat -f 作业ID 如图3所示,可以看到作业一共运行了4分10秒。 图3
执行以下命令,查看防火墙是否关闭成功。 # systemctl status firewalld.service 图1 成功关闭防火墙 依次登录集群中所有ECS,重复执行1.a~1.c,关闭所有ECS的防火墙。 修改配置文件。 登录集群中任意一台ECS。 执行以下命令,查看ECS的主机名。
-F 执行以下命令,查看防火墙是否关闭成功。 # service firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $
购买数量:待创建集群中弹性云服务器的数量。 单击“立即购买”。 在确认规格页面,您可以查看详情并提交申请。 如果确认信息无误,单击“提交订单”。 使用私有镜像创建的弹性云服务器创建成功后,您可以在弹性云服务器列表页查看详情,这些云服务器将被用作HPC集群。 API方式 以创建H2型ECS集群为例:
bashrc 验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时