Performance Evaluation of All-to-all Communication on PC Cluster Systems with Multi-Stage InfiniBand Networks

本稿では、Fat-tree InfiniBand(IB)ネットワーク上で全対全通信時のHot-spot発 生頻度を削減するルーティング手法を提案 · 評価する。Fat-tree IB ネットワークで は適切に使用ノードを選択しないと Hot-spot 発生により実効通信バンド幅が低下す る。提案手法は、各計算ノードに複数の LID(Local Identifier) を割当てる手法の一 種であり、具体的には全対全通信でよく用いられるシフト通信パターンに着目し、計 算ノード毎に適切な LIDを一つ選択 ·使用することで Hot-spot発生頻度を削減する 手法である。提案手法を OpenMPIに組込み、全対全通信性能を評価する。30 台の 計算ノードを 6-ary-2-tree構成の Fat-tree IBネットワークに接続した PCクラスタ システム上にて、任意 16 ノードによる全対全通信性能は従来手法と比較して平均で 34%向上することを確認している。

[1]  Xin Yuan,et al.  Automatic generation and tuning of MPI collective communication routines , 2005, ICS '05.

[2]  Amith R. Mamidala,et al.  Hot-Spot Avoidance With Multi-Pathing Over InfiniBand: An MPI Perspective , 2007, Seventh IEEE International Symposium on Cluster Computing and the Grid (CCGrid '07).

[3]  Michael Lang,et al.  Optimized InfiniBandTM fat‐tree routing for shift all‐to‐all communication patterns , 2010, Concurr. Comput. Pract. Exp..

[4]  Yeh-Ching Chung,et al.  A multiple LID routing scheme for fat-tree-based InfiniBand networks , 2004, 18th International Parallel and Distributed Processing Symposium, 2004. Proceedings..

[5]  Z. Ding,et al.  Level-wise Scheduling Algorithm for Fat Tree Interconnection Networks , 2006, ACM/IEEE SC 2006 Conference (SC'06).

[6]  Pedro López,et al.  Deterministic versus Adaptive Routing in Fat-Trees , 2007, 2007 IEEE International Parallel and Distributed Processing Symposium.