检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
方法一:购买高性能计算解决方案 操作场景 购买高性能计算解决方案可以在购买时同时指定管理节点配置与计算节点配置。本节操作介绍购买高性能解决方案的操作步骤。 购买须知 第一次使用公有云服务时,系统将自动为您创建一个虚拟私有云,包括安全组、网卡。同时,用户可根据需要自行创建一个虚拟私
集群云服务器节点创建完成,但在部署过程中失败了能否修复? 将集群删除,不要勾选“删除云服务器”,使用已有节点部署集群的方法重新部署集群。 父主题: 常见问题
方法二:使用已有节点部署HPC集群 操作场景 如果用户需要使用已有的ECS节点资源构建HPC集群,可以使用该功能进行集群的部署。下面介绍如何使用已有节点部署HPC集群。 使用已有节点部署集群,首先选择管理节点,再选择计算节点,切换计算节点与管理节点需要有相同的CPU架构,需要在相
执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录BMS。 $ ssh localhost 图1 免密登录BMS 系统回显结果如图1所示,可以无密钥登录本节点,表示权限配置成功。 依次登录集群中其他BMS,重复执行步骤1~5。 执行以下命令,验证参加测试的BMS之间是否可以免密码互相登录。
动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络) 使用 dtest 进行验证: server端(192.168.0.96):dtest -P ofa-v2-cma-roe-enp177s0
ip_local_port_range=”20000 65535” >> /etc/sysctl.conf 执行以下命令验证。 sysctl -a | grep ipv4 | grep range 修改内存限制 设置方法: 设置在内存中锁定进程的最大值无限制(单位:kbytes):ulimit -l unlimited
“export PATH=/home/openmpi-run/openmpi-4.0.1/bin:$PATH” >> /root/.bashrc 验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。
执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。其中hostname1为本主机名。 $ ssh localhost $ ssh hostname1 依次登录集群中其他ECS,重复执行步骤1~4。 执行以下命令,验证参加测试的ECS之间是否可以免密码互相登录。
执行以下命令,添加本主机私网IP地址和主机名。 # vi /etc/hosts 示例: 192.168.0.1 ecs-ff-0001 执行以下命令,ssh方式登录本节点,验证是否可以不输入密码登录ECS。 假设本主机的主机名为hostname1,则命令行如下: $ ssh localhost $ ssh hostname1
命令行,使用"--mca"参数。 Platform MPI场景下使用"-x"参数,OpenMPI场景下使用"--mca"参数。 2.若以上方法无法解决,请联系技术支持进行处理。 STAR-CCM+启动时,报错“Address is not valid” 问题现象: STAR-CC
reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配置文件,确保配置文件中“AuthorizedKeysFile”添加了“/usr/local/
请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。 父主题: 常见问题
使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables
使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables
# ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。 在ECS中使用以下命令,验证连通性。 # ping 192.168.23.35 执行以下命令,在ECS集群运行Intel MPI,。 以两台ECS为例: # mpirun
# ifconfig ib0 192.168.23.35/24 ... IP地址可随意指定,但需要在同一网段内。 在ECS中使用以下命令,验证连通性。 # ping 192.168.23.35 执行以下命令,在ECS集群运行Platform MPI。 以两台ECS为例: # mpirun
使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。
EIP quota”怎么办? 问题描述 集群创建任务提交失败,提示“Insufficient EIP quota”。 处理方法 您可以选择以下任一处理方法: EIP配额不足,创建集群时“弹性公网IP”可选择“使用已有”项。 EIP配额不足还可提工单申请扩大弹性公网IP的配额。 父主题:
programming interface)方式。 H2型、HI3型弹性云服务器使用带宽100Gb/s的IB网卡,更多关于H2型、HI3型弹性云服务器的使用方法与介绍,请参见《弹性云服务器用户指南》的“产品介绍 > 实例和应用场景”章节。 控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。