检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如: 192.168.0.1 bms-0004 192.168.0.2 bms-0005 ... 执行以下命令,添加hostfile文件。
b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如: 192.168.0.1 bms-0004 192.168.0.2 bms-0005 ... 执行以下命令,添加hostfile文件。
对于已完成HPC配置的弹性云服务器,您可以将其作为模板制作私有镜像,便于快速创建集群。该任务指导用户怎样将Linux弹性云服务器转化为私有镜像,包括管理控制台方式和基于HTTPS请求的API(Application programming interface)方式。 前提条件 已确保Linux云服务器网
b,获取所有BMS的主机名。 登录集群中任意一台BMS。 执行以下命令,添加hosts配置文件。 # vi /etc/hosts 添加的内容为集群中所有BMS的私网IP和主机名,例如: 192.168.0.1 bms-0004 192.168.0.2 bms-0005 ... 执行以下命令,添加hostfile文件。
集群创建完成后,如需查看集群中节点的详细信息,可进入一站式HPC服务提供的“节点管理”页,查看例如当前集群中节点,包括节点名称和ID、节点类型、状态、规格、IP、共享存储挂载状态、可用区以及付费类型等信息。 操作步骤 前提条件:用户集群的节点列表不为空。 登录HPC-S²控制台。 单击左侧的“节点管理”。
4~步骤2.6。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。
依次登录集群中所有ECS,重复执行2.d~2.f。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24 # ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。
$:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建BMS,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台BMS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将BMS对应的密钥文件(
执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,用“IP:Number”的形式作为MPI集群运行程序时的hostlist参数,在集群上通过Spectrum
前提条件 已成功创建ECS集群,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加
执行以下命令,给密钥文件配置权限。 $ sudo chmod 600 id_rsa 执行以下命令,查询主机名。 # hostname 执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。
TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,退出root权限。 # exit
TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,给参与测试的弹性云服务器配置主机名。
验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时 有业务时 父主题: 实施步骤
镜像中制作的私有镜像。 虚拟私有云:集群中的所有弹性云服务器需在同一VPC、同一子网内。 弹性IP:选择暂不购买。 一个集群绑定一个EIP即可。因此,可以在创建应用集群后,再绑定EIP。 购买数量:待创建集群中弹性云服务器的数量。 单击“立即购买”。 在确认规格页面,您可以查看详情并提交申请。
要保持所有节点一致,并且后面starccm使用platform方式启动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络) 使用 dtest 进行验证: server端(192.168
简介 图解HPC解决方案 HPC简介 HPC和公有云 IPoIB功能简介 配额调整
集群创建/扩容时,公共镜像当前只支持CentOS 7系列。 集群/节点执行删除操作时,请自行判断是否删除节点所绑定的弹性公网IP和挂载的数据盘。未删除的弹性公网IP和数据盘会持续产生扣费。 请不要在ECS控制台对HPC集群中的节点进行操作,以免集群出现异常。 请勿修改或删除“/usr/local/
或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master node cannot
新增 1.1-图解HPC解决方案 2019-02-15 第八次正式发布。 新增 配额调整 2018-09-30 第七次正式发布。 修改 安装和使用MPI(X86 BMS场景) 在HPC集群上运行MPI应用(X86 BMS场景) 2018-08-30 第六次正式发布。 增加 HPC断点续算计算方案