数学:并行计算:a_performance_model_for_evaluating_inter-node_device-side_communication
GPU主体のノード間通信を評価するための性能モデル
AI总结
目的
本文提出并验证了一种用于评估GPU主体(即GPU内核中直接进行)节点间通信性能的模型。研究背景是:近年来,为简化GPU集群编程,出现了直接在GPU内核内描述节点间通信的编程方式。然而,与传统的CPU主体通信模式相比,这种GPU主体通信在性能上是否有优势并不明确。因此,本论文旨在建立性能模型,并用实际实验加以评估,分析GPU主体通信方式的瓶颈与优劣。
手法
-
二重ルーフライン模型(双重Roofline模型)
基于传统Roofline模型思想,不再只关注算力和内存带宽,还引入通信带宽和通信延迟的影响。
模型横轴为节点内存访问量与节点间通信量的比值r,纵轴为带宽。性能由本地内存带宽、通信带宽、延迟等多个“屋顶”限制。
指出通信延迟L可能成为性能的主导瓶颈,尤其在GPU主体通信方式下。
-
结果
-
-
其他内容与亮点
/var/www/DokuWikiStick/dokuwiki/data/pages/数学/并行计算/a_performance_model_for_evaluating_inter-node_device-side_communication.txt · Last modified: 2025/07/20 08:16 by zhonghui