检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
节点删除时,如果所选节点挂载了数据盘,节点删除时不会删除数据盘,需要用户手动删除清理,否则会继续扣费。 单节点删除操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”; 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行删除操作的节点,单击操作列“删除”。 按需类型节点删除
AR-CCM+直接安装在NAS存储中,每个节点直接将NAS挂载到本地盘中,简化安装,使用更加方便。 购买SFS Turbo 1.在华为云控制台搜索“弹性文件服务 SFS”,并在弹性文件服务页面右上角选择“创建文件系统”。 图1 创建文件系统 2.在"创建文件系统"界面的"文件系统
集群/节点执行删除操作时,请自行判断是否删除节点所绑定的弹性公网IP和挂载的数据盘。未删除的弹性公网IP和数据盘会持续产生扣费。 请不要在ECS控制台对HPC集群中的节点进行操作,以免集群出现异常。 请勿修改或删除“/usr/local/.hpccluster”路径下文件内容,以免造成集群异常。
集群删除且勾选了删除云服务器时,集群节点锁挂在的数据盘是不会删除的,需要用户手动删除清理,否则会继续扣费。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面,对于不需要或异常的集群可进行删除操作。 按需类型集群 确定页可选择是否删除云服务器,如勾
执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,用“IP:Number”的形式作为MPI集
配置ECS集群互相免密登录 操作场景 该任务指导用户在ECS集群上进行相关设置,并使其可以相互免密登录。仅支持在使用密钥登录弹性云服务器的情况下配置ECS集群互相免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo
执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,退出root权限。 # exit 执行以下命令,添加hostfile文件。
执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,给参与测试的弹性云服务器配置主机名。 # hostnamectl
RDMA RDMA概念 远程直接内存访问(即Remote Direct Memory Access)是一种直接内存访问技术,它将数据直接从一台计算机的内存传输到另一台计算机,无需尤其是面对高性能计算HPC、大数据分析和浪涌型IO高并发、低时延应用,现有TCP/IP软硬件架构和应用
sysctl -a | grep ipv4 | grep range 修改内存限制 设置方法: 设置在内存中锁定进程的最大值无限制(单位:kbytes):ulimit -l unlimited 设置堆栈的最大值无限制(单位:kbytes):ulimit -s unlimited 验证方法:
第1个1表示备份文件系统,第2个1表示从/分区的顺序开始fsck磁盘检测,0表示不检测,_rnetdev 表示主机无法挂载直接跳过,避免无法挂载主机无法启动。 设置服务开机自启动 systemctl enable rpcbind systemctl enable nfs 父主题: 实施步骤
env 本例中执行sed -i 's/0x[a-f0-9]*/0xf05/g' ucx.env 图4 替换ucx中的PKEY 将ucx pkey设置为环境变量。 # sed -i 's/^UCX/export UCX/g' ucx.env # cat ucx.env >> ~/.bashrc
Spectrum MPI。 将1.a中下载的MPI软件包上传至运行MPI的BMS内(建议“/home/rhel”目录下)。 执行以下命令,设置环境变量。 如果选择自动接受IBM Spectrum MPI安装许可协议,执行以下命令: # export IBM_SPECTRUM_MP
hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4.2-1.2.0.0-redhat7.3-x86_64.tbz 执行以下命令,设置HPC-X环境变量。 $ cd hpcx-v2.0.0-gcc-MLNX_OFED_LINUX-4.2-1.2.0.0-redhat7.3-x86_64
RoCE RoCE概念 RDMA over Converged Ethernet (RoCE)是一种网络协议,允许应用通过以太网实现远程内存访问。目前RoCE有两个协议版本,v1和v2。其中RoCE v1是一种链路层协议,允许在同一个广播域下的任意两台主机直接访问。而RoCE v
配置单个ECS免密登录 操作场景 该任务指导用户在单个弹性云服务器内执行相关配置,使其可以免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建弹性云服务器,并绑定了弹性IP进行登录。
拷贝至“/share”目录。 make mpi 步骤3 配置lammps 算例输入文件。 以melt为例,生成一个算例melt.in文件。设置每迭代100步生成一个checkpoint文件,假定该文件存放在共享目录“/share”中。内容如下: # 3d Lennard-Jones
安装和使用IB驱动自带的Open MPI 操作场景 本节指导用户在BMS上安装和使用IB驱动自带的Open MPI(以版本3.1.0rc2为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。 操作步骤 查询是否安装了IB驱动。 执行以下命令,查询是否已成功安装IB驱动。
安装和使用Platform MPI 操作场景 本节指导用户在BMS集群上安装和使用Platform MPI应用(以版本platform_mpi- 09.01.04.03r-ce.bin为例)。 对于集群中的每台BMS,都需要执行该操作。 前提条件 已配置BMS集群间互相免密登录。