-
2个RoCE网卡Bond聚合,实现带宽X2
-
GPU A系列裸金属服务器如何进行RoCE性能带宽测试?
,即为当前网卡的接收速率,单位Byte/s。 方法2:使用ib_write_bw测试RDMA的读写处理确定带宽 服务器A:服务端从mlx4_0网卡接收数据 ib_write_bw -a -d mlx5_0 服务器B:客户端向服务端mlx4_0网卡发送数据。 ib_write_bw -a -F 服务器A的IP
来自:帮助中心 -
Standard资源池节点故障定位
其他 NPU其他错误。 检测到的其他NPU错误,通常为不可自纠正的异常,请联系技术人员支持。 A050149 NPU 链路 hccn tool网口闪断检查。 NPU网络不稳定,存在闪断情况。通过“hccn_tool-i ${device_id} -link_stat -g”查看24小时内闪断5次以上。
来自:帮助中心 -
NCCL性能调优参考
-
在HPC集群上运行Intel MPI
-
安装和使用IB驱动自带的Open MPI
-
为什么华为云上AI训练必须设置NCCL_IB_TC=128
-
【VPC-运维案例】05 IB网络出现问题时,如何排查?
-
安装Linux特殊驱动
-
【华为云网络技术分享】【第九弹】IB网络故障排查指导
-
CCI是否支持高速IB(Infiniband)网络?
-
在HPC集群上运行Platform MPI
-
安装和使用MPICH
-
API错误码2
-
安装和使用社区OpenMPI
-
怎样给IB网卡手动配置IP地址?
-
超高性能计算型
-
裸金属服务器规格与驱动对应关系
-
安装和使用IB驱动自带的Open MPI
-
安装和使用IB驱动自带的Open MPI
-
Linux 环境下 InfiniBand 组网认知