检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通讯录安装 Udapl安装和测试 Udapl安装 cd /root wget https://linux.mellanox.com/public/repo/mlnx_ofed/4.1-1.0.2.0/SRPMS/dapl-2.1.10mlnx-OFED.3.4.2.1.0.41102
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
RDMA RDMA概念 远程直接内存访问(即Remote Direct Memory Access)是一种直接内存访问技术,它将数据直接从一台计算机的内存传输到另一台计算机,无需尤其是面对高性能计算HPC、大数据分析和浪涌型IO高并发、低时延应用,现有TCP/IP软硬件架构和应用
挂载共享目录 安装软件 yum install nfs-utils 挂载SFS Turbo 将SFS Turbo挂载到/opt/Siemens目录 mkdir /opt/Siemens # 在/etc/fstab中添加开启自动挂载 echo "192.168.0.15:/ /opt/Siemens
RoCE RoCE概念 RDMA over Converged Ethernet (RoCE)是一种网络协议,允许应用通过以太网实现远程内存访问。目前RoCE有两个协议版本,v1和v2。其中RoCE v1是一种链路层协议,允许在同一个广播域下的任意两台主机直接访问。而RoCE v
B机器作为Server端,A机器作为Client端,dtest/rping测试RoCE网络仍异常。 解决方案: 1.请检查集群中每个节点的配置文件/etc/dat.conf中"ofa-v2-cma-roe-enp177s0"是否放在首行且每个节点都一致。 2.若以上方法无法解决,请联系技术支持处理。
STAR-CCM+启动时,报错“udapl version check failed” 解决方案: 1.请参考通信库安装章节的Udapl安装和测试中在/etc/dat.conf首行加入相应配置,需注意加在首行,放在末尾会出现提示“udapl version check failed”。 2.若以上方法无法解决,请联系技术支持处理。
STAR-CCM+安装与运行 安装STAR-CCM+ yum install libXt libXext libSM libX11 cd /root unzip siemens.star-ccm15.zip cd Siemens.STAR-CCM+15 tar zxvf STAR-CCM+15
删除时不要勾选“删除云服务器”,然后再使用“已有节点部署集群”的功能重新部署集群。 集群出现异常后,如无法手动进行恢复,可使用集群删除的功能将集群删除,删除时不要勾选“删除云服务器”,然后再使用“已有节点部署集群”的功能重新部署集群。 操作须知 删除集群时,集群管理节点所绑定的E
HPC-S²应用场景 计算资源创建:HPC-S²支持一键式报价和一键式购买HPC集群,并在创建集群时自动部署所配置的调度器、域控制器以及运行时的依赖。 计算资源配置:HPC-S²支持计算资源的多种配置管理,包括集群管理、节点管理、扩容集群节点及资源状态查看等。 HPC-S²使用限制 HPC解
卸载弹性文件服务。通过弹性文件服务SFS为集群提供共享存储的功能。 当集群为运行状态时,您可以选择挂载/卸载弹性文件服务。当集群在创建中或部署状态时,不支持挂载/卸载共享文件服务。 挂载共享存储 登录HPC-S²控制台。 单击左侧的“共享存储”进入共享存储管理页面。 在“共享存储”页,在左上角选择集群。
降低TCO 可以按需租用,成本低,降低中小客户使用HPC的门槛。 提高效率 按需发放,快速部署与扩容,加速产品上市时间和缩短科研周期。 使用灵活 在镜像模板中预制MPI库、编译库及优化配置,加快环境部署。 企业分支、科研组织机构等跨全球地理位置进行及时协同工作,提高效率。 可以利用公有
名中超过两个连续字符的部分。 Test12$@ (可选)高级配置。 如需使用“高级配置”中的功能,请单击“现在配置”。否则,请单击“暂不配置”。 用户数据注入:主要用于创建裸金属服务器时向裸金属服务器注入用户数据。配置用户数据注入后,裸金属服务器首次启动时会自行注入数据信息。 设置“裸金属服务器名称”。
本节操作介绍创建HPC集群的方式,以及创建流程,引导您一站式完成集群的创建、配置,并在HPC-S²上完成高性能计算作业。 部署方式简介 购买高性能计算解决方案:根据实际计算需求购买HPC集群,可以在购买时同时指定管理节点配置与计算节点配置。 图1 购买HPC集群 使用已有节点部署HPC集群:在已有节点资源的前提下,指
常见问题 为什么集群被删除后还在计费? 在部署/创建集群过程中出现某个节点未加入集群或者不存在需要怎么办? 集群云服务器节点创建完成,但在部署过程中失败了能否修复? 集群创建任务提交失败,提示“Insufficient EIP quota”怎么办? 集群创建提交失败,提示集群配额不足怎么办?
的高性能计算,同时集成基础服务、业务软件等,实现一键式开通部署等功能,支持常用作业调度软件,例如slurm、sge及华为多瑙(Huawei commercial HPC Donau Scheduler)调度器的自动化部署,使用HPC-S²控制台可以方便的对集群、节点以及共享存储进行查看以及管理操作。
弹性云服务器场景最佳实践 HPC断点续算计算方案 基于STAR-CCM+部署HPC集群
系统不会定期自动修改弹性云服务器密码。为安全起见,建议您定期修改密码。 高级配置 可选配置,如需使用“高级配置”中的功能,请单击“现在配置”。否则,请单击“暂不配置”。 文件注入 可选配置,主要用于创建弹性云服务器时向弹性云服务器注入脚本文件或其他文件。配置文件注入后,系统在创建弹性云服务器时自动将文件注入到指定目录下。
第十次正式发布 新增基于STAR-CCM+部署HPC集群 2021-08-11 第九次正式发布。 新增 1.1-图解HPC解决方案 2019-02-15 第八次正式发布。 新增 配额调整 2018-09-30 第七次正式发布。 修改 安装和使用MPI(X86 BMS场景) 在HPC集群上运行MPI应用(X86
HPC-S²与其他服务的关系 服务名称 HPC-S²与其他服务的关系 主要交互功能 弹性云服务器(ECS) 购买弹性云服务器创建HPC集群或使用已有弹性云服务器部署HPC集群。 自定义购买ECS 虚拟私有云(VPC) 同一个HPC场景的云服务器,都位于同一个VPC中,并且需要使用VPC中的子网和安全组进行相关的网络安全隔离。