2024-11-01から1ヶ月間の記事一覧
本項ではOpenMPIの依存関係を含めてビルドを行う方法を OpenMPIの依存関係のグラフ Makefile 事前設定 依存関係のビルド libevent hwloc OpenPMIX PRRTE 通信ライブラリのビルド UCXのビルド UCCのビルド OpenMPI のビルド そのほか 事後処理 関連 参考 Open…
UCCとは、集合通信操作APIであり、例えばOpenMPIから呼び出すことができます。 構成 OpenMPIから呼び出す どの通信レイヤ(Transport Layer)が使用されるか? 通信レイヤのスコア変更 参考 構成 ./src |-- coll_patterns ----- 集団通信パターンの実装(例:…
紹介する論文 Rajasekaran, S., Ghobadi, M., Kumar, G., & Akella, A. (2022, November). Congestion control in machine learning clusters. In Proceedings of the 21st ACM Workshop on Hot Topics in Networks (pp. 235-242). まとめ モチベーション 先…