检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性云服务器(ECS) 用于在公有云平台上创建高性能计算服务器。 虚拟私有云(VPC) HPC场景下所涉及的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组的相关网络安全隔离。 镜像服务(IMS) 在创建高性能计算的云服务器时,需要使用符合要求的镜像文件。 在制作私有镜
普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建BMS,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台BMS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将BMS对应的密钥文件(.pem文件)拷贝至.ssh目录下,命名为“id_rsa”。
配额调整 什么是配额? 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建弹性云服务器,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 将ECS对应的密钥文件(.pem文件,假设为*.pem)拷贝至.ssh目录下,命名为“id_rsa”。
执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时 有业务时 父主题: 实施步骤
内存空间与用户空间之间环境切换的次数。 没有CPU参与:应用程序可以访问远程内存,而不占用远程机器中的任何CPU。远程存储器将被读取,无需任何干预的远程进程(或处理器)。远程CPU中的缓存将不会被访问的内存内容填满。 基于消息的事务:数据被作为离散消息处理,而不是作为流,这消除了应用将流分成不同消息/事务的需要。
009_01_linux-x86_64-2.12_gnu7.1-r8.sh # 从STAR-CCM+官网买的正版软件中获取license,将license.dat文件放到/opt/Siemens 中 echo “export CDLMD_LICENSE_FILE=/opt/Siemens/license
购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。 创建虚拟私有云和子网 修改虚拟私有云基本信息 镜像服务(IMS) 可以使用公共镜像、私有
/sys/class/infiniband/mlx5_0/ports/1/pkeys/* | grep -v 0000 图2 查询pkey值 普通用户下,在~/.bashrc中添加如下语句: export MPI_ROOT=/opt/ibm/platform_mpi export PATH=$MPI_ROOT/bin:$PATH
卡的弹性云服务器。其中, 规格:需与转化的私有镜像的云服务器规格保持一致。 镜像:选择“私有镜像”,然后选择制作私有镜像中制作的私有镜像。 虚拟私有云:集群中的所有弹性云服务器需在同一VPC、同一子网内。 弹性IP:选择暂不购买。 一个集群绑定一个EIP即可。因此,可以在创建应用集群后,再绑定EIP。
前提条件 已确保Linux云服务器网卡设置为DHCP的方式动态获取网络地址。 已清理Linux云服务器中的udev配置规则。 已安装并配置Cloud-init工具。 已卸载Linux云服务器中挂载的所有数据盘。 控制台方式 登录管理控制台。 选择“计算 > 弹性云服务器”。 进入弹性云服务器信息页面。
普通用户切换至管理员用户,请使用命令sudo su。 前提条件 已成功创建ECS集群,并绑定了弹性IP进行登录。 操作步骤 使用“PuTTY”,采用密钥对方式登录集群中任意一台ECS。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,添加集群中所有主机的私网IP地址和主机名。 # vi /etc/hosts
执行以下命令,在集群中运行hostname命令。 # mpirun --allow-run-as-root -np <hostfile_node_number> -pernode --hostfile hostfile hostname 图1 在集群中运行hostname命令
常见问题 为什么集群被删除后还在计费? 在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办?
集群部署仅支持slurm和sge两种调度器。 集群部署支持鲲鹏架构的sge调度器,支持X86架构的slurm和sge调度器。 单个用户可创建集群的上限为3个。 单个集群中的计算节点的上限为2000个。 集群创建/扩容时,节点不能添加数据盘,如需使用,用户需手动挂载。 当前不支持集群恢复操作,创建失败或扩容失败的节点无法自动恢复。
密码至少包含以下4种字符中的3种: 大写字母 小写字母 数字 特殊字符,包括!@$%^-_=+[]{}:,./? 密码不能包含用户名或用户名的逆序。 Windows系统的裸金属服务器,不能包含用户名中超过两个连续字符的部分。 Test12$@ (可选)高级配置。 如需使用“高级配置”中的功能,请
product=IMS&api=Up dateImsInfo 按照图3进行信息填写, 其中 image_id 为制作的私有镜像 id,可以从镜像列表中获取。 图3 为创建的私有镜像打标签 请求体:[ {"op": "add", "path": "/__support_c6_22xl_physical"
计费模式为“按需付费”时,如果您确认规格和价格无误,请勾选同意协议,单击“提交”。 提交/支付成功后,返回到集群管理页面,可查看到集群列表中该集群已经是“创建中”了,等待集群创建完成变成“运行中”代表集群创建完成。 后续操作 如需查看集群详情、节点列表、共享存储信息,请参考查看HPC集群 父主题: 快速入门
v2是一种Internet层协议,即可以实现路由功能。虽然RoCE协议这些好处都是基于融合以太网的特性,但是RoCE协议也可以使用在传统以太网网络或者非融合以太网络中。 应用场景 网络密集型应用,例如存储或者集群计算等,需要网络支持大带宽和低时延特性。RDMA的优势相比其他网络应用程序接口,例如Berke
集群。 卸载共享存储 登录HPC-S²控制台。 单击左侧的“共享存储”进入共享存储管理页面。 在“共享存储”页,在左上角选择集群。 在列表中查看当前集群挂载的弹性文件服务,选择待卸载的弹性文件服务,在操作列下单击“卸载”。 单击“确定”,卸载弹性文件服务 父主题: 共享存储