nccl-test

参考文章

 

nccl-test 工具介绍

nccl-tests 是 NVIDIA 官方提供的一套用于测试和基准化 NCCL 性能的工具集。它包含了针对各种集合通信原语(如 All-Reduce, All-Gather, Broadcast 等)的测试程序,可以帮助用户评估多 GPU 或多节点环境下的通信带宽和延迟。

基本使用示例

编译 nccl-tests (通常在 NCCL 源码目录下):
运行 All-Reduce 测试 (例如,测试 2个GPU,数据大小为 8M):
运行 All-Gather 测试 (例如,测试 4个GPU,数据大小为 16M):
更多选项和测试类型,请参考 nccl-tests 的官方文档或运行程序时使用 --help 参数。
上一篇
GPU通信方式
下一篇
NCCL
Loading...
文章列表

加载中