检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发、低时延应用,现有TCP/IP软硬件架构和应用高CPU消耗的技术特征根本不能满足应用的需求。 RDMA优势 零复制:零复制网络技术使网卡可以直接与应用内存相互传输数据,从而消除了在应用内存与内核之间复制数据的需要。因此,传输延迟会显著减小。 内核旁路:内核协议栈旁路技术使应用程
重启节点 操作场景 当集群中某节点出现异常,可以使用节点重启的功能对该节点进行重启操作尝试恢复。 只有状态为“运行中”的节点可进行重启操作。 操作步骤 登录HPC-S²控制台。 单击左侧的“节点管理”。 在“节点管理”页面集群的下拉框切换到要进行节点操作的集群。 选择要进行停止操作的节点,单击操作中“更多
节点删除 操作场景 集群当前的节点数较多,可以选择将部分节点进行删除,对集群进行缩容操作以同时节省费用。 集群中某个节点出现异常且无法手动恢复后,可使用节点删除将该节点进行删除操作,随后根据需要再重新进行集群扩容操作。 操作须知 无论单节点删除或是批量删除,管理节点是禁止删除操作的。
UCX/g' ucx.env # cat ucx.env >> ~/.bashrc 配置mpi环境变量。 使用vim编辑“~/.bashrc”文件,添加如下配置内容: export PATH=$PATH:/usr/mpi/gcc/openmpi-4.0.2a1/bin export
0-rhel7.3-x86_64/ # ./mlnxofedinstall 配置环境变量。 执行以下命令,使用vim编辑“~/.bashrc”文件,添加如下配置内容。 export PATH=$PATH:/usr/mpi/gcc/openmpi-3.0.0rc6/bin export
解压。 # tar -xzvf openmpi-3.1.1.tar.gz # cd openmpi-3.1.1 执行以下命令,安装需要的库文件。 # yum install binutils-devel.x86_64 libibverbs-devel 执行以下命令,编译安装OpenMPI。
0" "" ofa-v2-cma-roe-enp177s0为配置名称,可以修改,但是要保持所有节点一致,并且后面starccm使用platform方式启动时候需要使用该配置名称。 enp177s0为网卡名称,可以使用ip a或者ipconfig查看到。 验证Udapl(使用dtest测试RoCE网络)
此IPoIB的MTU值要小于IB链路层的MTU值。 在connected模式下,queue pair允许发送比IB链路层更大的报文,理论上可以发送大小65535长度的报文。 connected模式具有更好的性能,但是会消耗系统更多的内存。多数系统更关注性能,因此大多数场景下IB网口配置为connected模式。