检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么集群被删除后还在计费? 按需购买的集群删除时未勾选“删除云服务器”,因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的E
0.0rc6为例)。 前提条件 已配置弹性云服务器免密登录。 操作步骤 检查是否已安装IB驱动。 使用“PuTTY”,采用密钥对方式登录弹性云服务器。 执行以下命令,切换为root 用户。 $ sudo su 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,查询是否已安装IB驱动。
在connected模式下,queue pair允许发送比IB链路层更大的报文,理论上可以发送大小65535长度的报文。 connected模式具有更好的性能,但是会消耗系统更多的内存。多数系统更关注性能,因此大多数场景下IB网口配置为connected模式。 当前版本的网卡驱动不支持connected模式。
式登录弹性云服务器。 Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。 表3 密码设置规则 参数 规则 样例 密码 密码长度范围为8到26位。 密码至少包含以下4种字符中的3种: 大写字母 小写字母 数字 Wind
常见问题 为什么集群被删除后还在计费? 在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办?
添加集群中所有ECS的主机名,例如: host-192-168-0-1 host-192-168-0-2 ... 依次登录集群中所有ECS,重复执行2.d~2.f。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24
操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts 添加的内容为集群中所有ECS的私网IP地址和主机名,例如: 192
env 替换ucx中的PKEY。 # sed -i 's/0x[a-f0-9]*/{pkey}/g' ucx.env 本例中执行sed -i 's/0x[a-f0-9]*/0xf05/g' ucx.env 图4 替换ucx中的PKEY 将ucx pkey设置为环境变量。 # sed
在任意一台BMS中执行以下命令,运行MPI benchmark,运行时指定hostfile路径。 以两个BMS为例: $ mpirun -np 2 -pernode --hostfile hostfile -mca btl_openib_if_include "mlx5_0:1" -x
操作场景 集群使用过程中,如当前的集群规模已经不满足需要,可使用集群扩容功能对集群进行扩容操作以增加节点数。 只有状态为“运行中”的集群可进行扩容操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要扩容的集群,单击后方操作中“扩容”,进入扩容的详情页面。
已成功创建弹性云服务器,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将ECS对应的密钥文件(.pem文件,假设为*.pem)拷贝至.ssh目录下,命名为“id_rsa”。
安装和使用Spectrum MPI 操作场景 本节指导用户在BMS集群上安装和使用Spectrum MPI应用(以版本10.01.01为例)。 对于集群中的每台BMS,都需要执行该操作。 背景信息 IBM Spectrum MPI v10.1版本当前支持的操作系统列表如下: IBM Spectrum
ofa-v2-cma-roe-enp177s0 u2.0 nonthreadsafe default libdaplofa.so.2 dapl.2.0 "enp177s0 0" "" ofa-v2-cma-roe-enp177s0为配置名称,可以修改,但是要保持所有节点一致,并
mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens nfs vers=3,timeo=600,nolock 0 0" >> /etc/fstab 执行mount -a 备注: 192
该节点状态为“运行中”。 该节点绑定了弹性IP。 该节点不在当前账号下的其他集群中。 选择“安全组” 安全组为选定的管理节点所使用的安全组策略,如果有多个策略,可根据需要选择。 选择“计算节点” 计算节点的筛选需要满足以下条件: 当前指定区域的ECS节点。 计算节点状态为“运行中”。
云服务器。 Linux操作系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足表2要求。 表2 密码规则 参数 规则 样例 密码 密码长度范围为8到26位。 密码至少包含以下4种字符中的3种: 大写字母 小写字母 数字
host-192-168-0-1 host-192-168-0-1 ... 依次登录集群中所有ECS,重复执行步骤2.4~步骤2.6。 配置IB网卡的IP地址。 对集群中所有的ECS,执行以下命令,为IB驱动配置IP地址。 # ifconfig ib0 192.168.23.34/24
Turbo提供按需扩展的高性能文件存储(NAS),可为云上多个弹性云服务器(Elastic Cloud Server,ECS),容器(CCE&CCI),裸金属服务器(BMS)提供共享访问,能够弹性伸缩至320TB规模,具备高可用性和持久性,为海量的小文件、低延迟高IOPS型应用提供有力支持。 使用背景 ST
系统时为root用户的初始密码,Windows操作系统时为Administrator用户的初始密码。密码复杂度需满足表2要求。 Windows裸金属服务器不支持选择密码登录方式。 表2 密码规则 参数 规则 样例 密码 密码长度范围为8到26位。 密码至少包含以下4种字符中的3种:
MPI运行可执行文件。其中, IP代表集群中的弹性云服务器IP地址。 Number代表该弹性云服务器的任务数。 假设集群中共有两个弹性云服务器,主机名分别是host-192-168-0-27和host-192-168-0-75,可执行程序的目录为/root/spe_hello,文件名为spe_hello,则命令行如下: