-
RoCE网络问题 - 高性能计算 HPC
RoCE网络问题 dtest或rping打流测试网络双向不通问题 问题现象: dtest/rping打流测试网络双向不通问题:A机器作为Server端,B机器作为Client端,dtest/rping测试RoCE网络异常;调换A、B机器角色,B机器作为Server端,A机器作为C
-
IPoIB功能简介 - 高性能计算 HPC
over InfiniBand),指利用物理IB网络(包括服务器上的IB卡、IB连接线、IB交换机等)通过IP协议进行连接,并进行数据传输。 它提供了基于RDMA之上的IP网络模拟层,允许应用无修改的运行在InfiniBand网络上。但是,IPoIB性能比RDMA通信方式性能要低
-
RoCE - 高性能计算 HPC
但是RoCE协议也可以使用在传统以太网网络或者非融合以太网络中。 应用场景 网络密集型应用,例如存储或者集群计算等,需要网络支持大带宽和低时延特性。RDMA的优势相比其他网络应用程序接口,例如Berkeley接口,就是低时延,低CPU负载和大带宽。RoCE可以比iWARP协议要实现更低的时延。
-
创建支持IB网卡的弹性云服务器 - 高性能计算 HPC
系统盘:超高I/O,40GB 设置网络,包括“虚拟私有云”、“安全组”、“网卡”、“弹性IP”等信息。 第一次使用公有云服务时,系统将自动为您创建一个虚拟私有云,包括安全组、网卡。 表2 参数说明 参数 解释 取值样例 虚拟私有云 弹性云服务器网络使用虚拟私有云(VPC)提供的网络,包括子网、安全组等。
-
通讯录安装 - 高性能计算 HPC
动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络) 使用 dtest 进行验证: server端(192.168.0.96):dtest -P ofa-v2-cma-roe-enp177s0
-
在HPC集群上运行社区OpenMPI - 高性能计算 HPC
TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables -F # service firewalld stop 执行以下命令,给参与测试的弹性云服务器配置主机名。
-
HPC和公有云 - 高性能计算 HPC
是一种海量数据传输服务,它使用物理存储介质(USB或eSATA接口)向华为公有云传输大量数据。解决了海量数据在互联网上传输的难题(高昂网络带宽成本、较长传输时间等)。 虚拟专用网络(VPN) 是在用户的其他数据中心和公有云之间建立的一条符合行业标准的安全加密通信隧道,可将已有数据中心无缝扩展到公有云上。
-
制作私有镜像 - 高性能计算 HPC
plication programming interface)方式。 前提条件 已确保Linux云服务器网卡设置为DHCP的方式动态获取网络地址。 已清理Linux云服务器中的udev配置规则。 已安装并配置Cloud-init工具。 已卸载Linux云服务器中挂载的所有数据盘。
-
RDMA - 高性能计算 HPC
内核旁路:内核协议栈旁路技术使应用程序无需执行内核内存调用就可向网卡发送命令。在不需要任何内核内存参与的条件下,RDMA请求从用户空间发送到本地网卡并通过网络发送给远程网卡,这就减少了在处理网络传输流时内核内存空间与用户空间之间环境切换的次数。 没有CPU参与:应用程序可以访问远程内存,而不占用远程机器中的任何C
-
在HPC集群上运行IB驱动自带的OpenMPI - 高性能计算 HPC
使用“PuTTY”,采用密钥对方式登录弹性云服务器。 登录用户为创建弹性云服务器时指定的用户名。 执行以下命令,防止系统超时退出。 # TMOUT=0 执行以下命令,验证参加测试的弹性云服务器之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 执行以下命令,关闭弹性云服务器的防火墙。 # iptables
-
方法一:购买高性能计算解决方案 - 高性能计算 HPC
靠近您业务的区域,可减少网络时延,提高访问速度。 选择“可用区”。 可用区指在同一区域下,电力、网络隔离的物理区域,可用区之间内网互通,不同可用区之间物理隔离。 如果您需要提高应用的高可用性,建议您将弹性云服务器创建在不同的可用区。 如果您需要较低的网络时延,建议您将弹性云服务器创建在相同的可用区。
-
MPI安装 - 高性能计算 HPC
验证MPI运行在RoCE网络上 执行以下命令,安装iproute2。 yum -y install iproute* 执行以下命令,查看RoCE上是否有流量。 rdma res show 若MPI运行中,回显结果中qp 数量较大(大于1),则证明运行在 RoCE 网络上: 无业务时 有业务时
-
常见问题 - 高性能计算 HPC
常见问题 RoCE网络问题 STAR-CCM+启动相关问题 父主题: 附录
-
创建裸金属服务器集群 - 高性能计算 HPC
弹性IP选择“现在购买”时,需配置该参数。 全动态BGP:可以根据设定的寻路协议实时自动优化网络结构,以保持客户使用的网络持续稳定、高效。 静态BGP:网络结构发生变化时,无法实时自动调整网络设置以保障用户体验。 计费方式 弹性IP选择“现在购买”时,需配置该参数。 按带宽计费:指
-
方法二:使用已有节点部署HPC集群 - 高性能计算 HPC
单击“部署HPC集群”。 系统进入部署HPC集群页面。 选择“区域”。 不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。 设置集群名称。 名称可自定义,但需符合命名规则。集群名称命名规则如表1所示。 表1 集群名称命名规则 参数 规则 样例
-
什么是HPC-S² - 高性能计算 HPC
Scheduler)调度器的自动化部署,使用HPC-S²控制台可以方便的对集群、节点以及共享存储进行查看以及管理操作。 如图1所示,通过HPC-S²控制台用户可以管理多个VPC网络下的多个集群。 图1 HPC-S²架构示意图 HPC-S²功能简介 HPC-S²主要面向对大规模计算有需求的企事业单位,使用HPC-S²控
-
创建SFS Turbo - 高性能计算 HPC
要,选择"HPC型"或"HPC缓存型"文件系统类型。 图2 选择文件系统类型 3.在"创建文件系统"界面的"选择网络"选项中,需注意与购买的弹性云服务器选择相同的网络配置。 4.在"创建文件系统"界面的其他选项中请您根据业务需要,按需填写即可,填写完成后点击购买,完成创建。 图3
-
配置BMS集群互相免密登录 - 高性能计算 HPC
免密登录BMS 系统回显结果如图1所示,可以无密钥登录本节点,表示权限配置成功。 依次登录集群中其他BMS,重复执行步骤1~5。 执行以下命令,验证参加测试的BMS之间是否可以免密码互相登录。 $ ssh 用户名@SERVER_IP 父主题: 裸金属服务器场景典型应用
-
方案概述 - 高性能计算 HPC
可以利用公有云的跨地域能力,共享计算资源,海量数据,并能实现云端大数据分析。 优化性能 性能比普通云服务器大幅提升。 通过虚拟化优化(SR-IOV、PCI直通)等,各类测试报告显示:大规模云化HPC性能损耗不大。 约束与限制 MPI和通讯库的版本需要提前适配RoCE,请联系技术支持进行操作,建议使用推荐版本运行STAR-CCM+。
-
配置ECS集群互相免密登录 - 高性能计算 HPC
$ ssh localhost $ ssh hostname1 依次登录集群中其他ECS,重复执行步骤1~4。 执行以下命令,验证参加测试的ECS之间是否可以免密码互相登录。 假设集群中有2个弹性云服务器,另一个云服务器的主机名为hostname2,则命令行为: $ ssh 用户名@SERVER_IP