检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
购买弹性云服务器 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 单击"",选择“计算 > 弹性云服务器”。 单击“购买弹性云服务器”,系统进入购买页后按图1步骤进行操作。 图1 购买弹性云服务器 父主题: 实施步骤
在HPC集群上运行MPI应用 在HPC集群上运行IB驱动自带的OpenMPI 在HPC集群上运行社区OpenMPI 在HPC集群上运行Spectrum MPI 在HPC集群上运行Intel MPI 在HPC集群上运行Platform MPI 父主题: 弹性云服务器场景典型应用
配置ECS集群互相免密登录 操作场景 该任务指导用户在ECS集群上进行相关设置,并使其可以相互免密登录。仅支持在使用密钥登录弹性云服务器的情况下配置ECS集群互相免密登录。 背景信息 $:表示在普通用户下,执行相关操作。 #:表示在管理员用户下,执行相关操作。 普通用户切换至管理员用户,请使用命令sudo
在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 可同时在节点列表左侧勾选多个要进行删除操作的节点,单击集群名称左侧的“删除”。 按需类型节点批量删除 选择是否删除云服务器资源,如勾选,连同云服务器一同删除,如不勾选,则只删除节点信息,对应的云服务器节点仍保留,用户可通过弹性云服务器页面查看。 包周期类型节点批量删除
附录 常见问题 主要概念 父主题: 基于STAR-CCM+部署HPC集群
实施步骤 创建HPC私有镜像 创建弹性云服务器 配置节点互信 创建SFS Turbo 挂载共享目录 通讯录安装 MPI安装 STAR-CCM+安装与运行 父主题: 基于STAR-CCM+部署HPC集群
MPI安装 Platform MPI安装 PlatformMPI使用STAR-CCM+自带的,不需要安装。 OpenMPI安装(可选) 若使用STAR-CCM+自带的,可不用安装。 cd /root tar zxvf openmpi-4.0.1.tar.gz cd openmpi-4
主要概念 RDMA RoCE 父主题: 附录
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
集群云服务器节点创建完成,但在部署过程中失败了能否修复? 将集群删除,不要勾选“删除云服务器”,使用已有节点部署集群的方法重新部署集群。 父主题: 常见问题
挂载共享目录 安装软件 yum install nfs-utils 挂载SFS Turbo 将SFS Turbo挂载到/opt/Siemens目录 mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens
太网网络或者非融合以太网络中。 应用场景 网络密集型应用,例如存储或者集群计算等,需要网络支持大带宽和低时延特性。RDMA的优势相比其他网络应用程序接口,例如Berkeley接口,就是低时延,低CPU负载和大带宽。RoCE可以比iWARP协议要实现更低的时延。 父主题: 主要概念
停止集群 操作场景 按需类型的集群,如暂时没有任务需要执行,可使用集群停止功能对集群进行管理操作以节省费用。 包周期资源不适用,关机后仍继续扣费,需手动退订后可停止扣费。 有集群状态为“运行中”的集群可进行停止操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。
已确保Linux云服务器网卡设置为DHCP的方式动态获取网络地址。 已清理Linux云服务器中的udev配置规则。 已安装并配置Cloud-init工具。 已卸载Linux云服务器中挂载的所有数据盘。 控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。 进入弹性云服务器信息页面。
创建SFS Turbo 功能介绍 SFS Turbo提供按需扩展的高性能文件存储(NAS),可为云上多个弹性云服务器(Elastic Cloud Server,ECS),容器(CCE&CCI),裸金属服务器(BMS)提供共享访问,能够弹性伸缩至320TB规模,具备高可用性和持久性
创建HPC私有镜像 前提条件 创建镜像需选择ECS系统盘镜像。 需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。
配置节点互信 配置节点互信免密登录 STAR-CCM+集群运行时候需要跨节点运行,推荐使用互信免密登录。 # 生成ssh公钥和私钥 ssh-key-gen # 拷贝公钥到指定主机的~/.ssh/authorized_key文件中 ssh-copy-id root@目标主机IP 例如:ssh-copy-id
通讯录安装 Udapl安装和测试 Udapl安装 cd /root wget https://linux.mellanox.com/public/repo/mlnx_ofed/4.1-1.0.2.0/SRPMS/dapl-2.1.10mlnx-OFED.3.4.2.1.0.41102
启动集群 操作场景 停止状态的集群,如需再次开启集群执行作业,可将集群重新启动。 只有状态为“停止”的集群可进行启动操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要启动的集群,单击后方操作列“更多 > 启动”。 单击“确定”。 在集群管
A、B机器角色,B机器作为Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。