检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”怎么办? 问题描述 集群的管理节点为运行状态,但是集群异常提示“master node cannot reached”。 处理方法 检查“/etc/ssh/sshd_config”配
集群创建提交失败,提示集群配额不足怎么办? 每个用户只能创建最多3个集群,当集群数量达到上限后会提示该错误,如需创建新集群,可先将不使用或者异常状态的集群进行删除,然后再重新创建集群。 父主题: 常见问题
EIP quota”怎么办? 问题描述 集群创建任务提交失败,提示“Insufficient EIP quota”。 处理方法 您可以选择以下任一处理方法: EIP配额不足,创建集群时“弹性公网IP”可选择“使用已有”项。 EIP配额不足还可提工单申请扩大弹性公网IP的配额。 父主题:
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 问题描述 在部署/创建集群过程中,如果出现某个节点未加入集群或节点不存在,那么集群将无法正常部署/创建。 处理方法 可删除集群重新创建,选择其中创建成功的计算节点手动绑定EIP,然后和其他计算节点重新创建集群。 删除状态异常的节点,从而使集群状态恢复正常。
在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办? 集群的管理节点为运行状态,但是集群异常提示“master
常见的标准操作系统镜像,所有用户可见,包括操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 选择“公共镜像”,并展开下拉框,选择所需的公共镜像。 私有镜像 用户基于弹性云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。
该节点不在当前账号下的其他集群中。 选择“安全组” 安全组为选定的管理节点所使用的安全组策略,如果有多个策略,可根据需要选择。 选择“计算节点” 计算节点的筛选需要满足以下条件: 当前指定区域的ECS节点。 计算节点状态为“运行中”。 计算节点与管理节点为相同的CPU架构。 计算节
C6h实例为弹性云服务器下的一款裸金属产品,相比于普通的裸金属产品,C6h实例除了提供标准的以太网卡,还提供了一个支持RoCE协议的网卡,而RoCE协议相比于普通的以太协议最大的优势在于时延极低,特别适合HPC场景低时延业务。 购买弹性云服务器 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。
使计算机的结构更加简单合理地提高运行速度,相对于X86 CPU架构具有更加均衡的性能功耗比。鲲鹏的优势是高密度低功耗,可以提供更高的性价比。 选择“管理节点配置”。 规格:公有云提供了多种类型的弹性云服务器供您选择,单击下拉框查看支持的云服务器规格。 系统盘:根据所需要的选择磁盘类型和大小。
需的私有镜像。 共享镜像 您将接受其他用户共享的私有镜像,作为自己的镜像进行使用。 选择“共享镜像”,并展开“镜像”的下拉框,选择所需的共享镜像。 选择“许可证类型”。 在云平台上使用操作系统或软件的许可证类型。如果您选择的镜像为免费的,则系统不会展示该参数。如果您选择的镜像为计费镜像,此时系统会展示该参数。
需修改镜像属性才能在ECS创建界面的C6h规格中选择到相应的镜像。 镜像获取 请联系技术支持进行操作。 创建系统盘镜像 请使用镜像文件创建系统盘镜像,需注意镜像用途选择ECS系统盘镜像如图1,选择启动方式为UEFI图2,否则系统无法启动。 图1 创建系统盘镜像 图2 选择启动方式 为创建的私有镜像打标签 登录到 API
计算密集型、海量数据处理等业务的计算需求,如科学研究、气象预报、计算模拟、军事研究、CAD/CAE、生物制药、基因测序、图像处理等,缩短需要的大量计算时间,提高计算精度。 方案架构 方案优势 降低TCO 可以按需租用,成本低,降低中小客户使用HPC的门槛。 提高效率 按需发放,快
集群创建完成后,如需查看集群的详细信息,可进入一站式HPC服务提供的“集群详情”页,查看例如当前集群的ID、状态、所在区域、虚拟私有云、安全组、节点信息以及共享存储以及集群的关系图等信息。 操作步骤 登录HPC-S²控制台。 单击左侧的“集群管理”。 在“集群管理”页面选择要查看的集群,单击集群名称查看集群详情页。
gids:查下设备名和index。 UCX_NET_DEVICES: hiroce gids查到的有ip值一行的ib_dev的值: port的值。 UCX_IB_GID_INDEX:hiroce gids查到的有ip值一行的idx的值。 2.若以上方法无法解决,请联系技术支持进行处理。 STAR-CCM+启动时,报错“udapl
可以方便的对集群、节点以及共享存储进行查看以及管理操作。 如图1所示,通过HPC-S²控制台用户可以管理多个VPC网络下的多个集群。 图1 HPC-S²架构示意图 HPC-S²功能简介 HPC-S²主要面向对大规模计算有需求的企事业单位,使用HPC-S²控制台可以方便的对集群、节
在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。 HPC的业务特点 科学研究、气象预报、仿真实验、生物制药、基因测序、图像处理等行业都涉及高性能计算集群来解决大型计算问题,管理节点对计算任务进行分解,交给不同的计算节点完成计算。 各种业
MAKE/Makefile.mpi 根据图1、图2,修改红框标识中的内容。其中,版本号需根据实际情况进行填写。 只修改图1、图2中红框标识的内容。 图1 修改Makefile文件01 图2 修改Makefile文件02 执行以下命令,编译lammps,并将当前目录生成的lmp_mpi文件拷贝至“/share”目录。
执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图5 查看IB 驱动自带的Open MPI 环境变量 如果回显如图5所示,表示环境变量配置成功。 执行以下命令,在单台BMS上运行IB驱动自带的Open MPI。 #mpirun -np 2 -mca btl_openib_if_include
执行以下命令,查看MPI环境变量是否正常。 $ which mpirun 图3 查看IB驱动自带的Open MPI环境变量 如果回显如图3所示,表示环境变量配置成功。 执行以下命令,在单台BMS上运行IB驱动自带的Open MPI。 $ mpirun -np 2 -mca btl_openib_if_include
firewalld status 图1 确认关闭防火墙成功 依次登录集群中所有BMS,重复执行1.b~1.c,关闭所有BMS的防火墙。 修改配置文件。 登录集群中任意一台BMS。 执行以下命令,查看BMS的主机名。 $ hostname 图2 查看BMS的主机名 依次登录集群中所有BMS,重复执行1