检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
RoCE网络问题 dtest或rping打流测试网络双向不通问题 问题现象: dtest/rping打流测试网络双向不通问题:A机器作为Server端,B机器作为Client端,dtest/rping测试RoCE网络异常;调换A、B机器角色,B机器作为Server端,A机器作为C
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
常见问题 为什么集群被删除后还在计费? 在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办?
+指定的物理核数。 ip1,ip2:运行STAR-CCM+指定的主机信息。 core_num1,core_num2:指定每个主机运行的物理核数。 hiroce gids:查下设备名和index。 UCX_NET_DEVICES: hiroce gids查到的有ip值一行的ib_dev的值:
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
为什么集群被删除后还在计费? 按需购买的集群删除时未勾选“删除云服务器”,因此只删除了集群信息,集群中的云服务器资源仍在继续扣费。 包周期类型的集群删除时只能删除集群信息,云服务器资源需要手动退订。 管理节点如使用购买EIP的选择,集群删除时,即使勾选了“删除云服务器”,绑定的EIP资源也不会删除
集群创建提交失败,提示集群配额不足怎么办? 每个用户只能创建最多3个集群,当集群数量达到上限后会提示该错误,如需创建新集群,可先将不使用或者异常状态的集群进行删除,然后再重新创建集群。 父主题: 常见问题
computing,简称HPC)是一个计算机集群系统,通过管理节点对计算任务进行分解,交给不同的计算节点进行计算,以此来解决大型计算问题。在科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业均有广泛的应用。 针对日益增长的HPC计算能力需求,华为云在现有基础设施之上推出了HPC解决方案服务(HPC
quota”怎么办? 问题描述 集群创建任务提交失败,提示“Insufficient EIP quota”。 处理方法 您可以选择以下任一处理方法: EIP配额不足,创建集群时“弹性公网IP”可选择“使用已有”项。 EIP配额不足还可提工单申请扩大弹性公网IP的配额。 父主题: 常见问题
集群云服务器节点创建完成,但在部署过程中失败了能否修复? 将集群删除,不要勾选“删除云服务器”,使用已有节点部署集群的方法重新部署集群。 父主题: 常见问题
在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。 HPC的业务特点 科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业都涉及高性能计算集群来解决大型计算问题,管理节点对计算任务进行分解,交给不同的计算节点完成计算。 各种业
群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。
HPC-S²与其他服务的关系 服务名称 HPC-S²与其他服务的关系 主要交互功能 弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。
0rc6/bin/mpirun 图1 已安装IB驱动 如果上述两条命令均有如图1所示的返回值,则已安装IB驱动,执行3。 如果返回值与图1不同,表示弹性云服务器未安装IB驱动,执行2。 下载并安装对应的IB驱动。 在Mellanox官网https://network.nvidia.c
常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 选择“公共镜像”,并展开下拉框,选择所需的公共镜像。 私有镜像 用户基于弹性云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。
自动部署失败的情况。 公共镜像(推荐) 标准操作系统镜像,所有用户可见,当前仅支持CentOS 7系列,包括操作系统以及预装的公共应用。请根据您的实际情况自助选择。 私有镜像 用户基于弹性云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择
在HPC集群上运行MPI应用 在HPC集群上运行IB驱动自带的OpenMPI 在HPC集群上运行社区OpenMPI 在HPC集群上运行Spectrum MPI 在HPC集群上运行Intel MPI 在HPC集群上运行Platform MPI 父主题: 弹性云服务器场景典型应用
在HPC集群上运行MPI应用(鲲鹏BMS场景) 该任务指导以CentOS 7.6的操作系统为例在集群上运行MPI应用。 安装和使用IB驱动自带的Open MPI 安装和使用社区OpenMPI 安装和使用MPICH 父主题: 裸金属服务器场景典型应用
MPI和在HPC集群上运行Platform MPI,弹性云服务器支持使用Platform MPI。 修改 IB驱动自带的OpenMPI 社区OpenMPI Spectrum MPI Intel MPI 在HPC集群上运行IB驱动自带的OpenMPI 在HPC集群上运行社区OpenMPI 在HPC集群上运行Spectrum
弹性云服务器场景最佳实践 HPC断点续算计算方案 基于STAR-CCM+部署HPC集群