Differences

This shows you the differences between two versions of the page.

--- 自作クラスタ計算機:mpiによる並列計算 [2020/03/02 15:02]
koudai [準備]
+++ 自作クラスタ計算機:mpiによる並列計算 [2020/03/02 18:04]
koudai [ノード間並列計算]
@@ Line 9: / Line 9: @@
 ====== 準備 ======
+===== ハードウェアの確認 =====
 事前に各ノードのCPUのコア数（物理コア数）とスレッド数（論理コア数）を確認してください
@@ Line 19: / Line 21: @@
     * 表示される行数が スレッド数 = CPU数 × CPUあたりのコア数 に対応します。通常は論理コア数と物理コア数は等しいですが、Hyper-Threadingが有効の場合は論理コア数が物理コア数の2倍になります。
       * Hyper-Threadingは見かけ上のコア数が2倍になる技術であり、並列計算プログラムで並列化効率が良い場合は逆に計算速度が著しく低下します。これは1つの物理コアに2つのジョブが投入されてしまうために発生します。
-      * 並列化されたスレッドごとの並列化効率が著しく悪く、1つのスレッドの計算が終わっているのに別のスレッドの計算は続いている、というような場合にのみ有効です。
+      * スレッドごとの計算の重さのバランスが著しく悪く、1つのスレッドの計算が終わっているのに別のスレッドの計算は続いている、というような場合にのみ有効です。
       * よくわからない場合は、BIOSを使ってHyper-Threadingをオフにするか、MPIでのジョブ投入時に並列数を物理コア数以下にすることが望ましいです。
+===== SSHの導入 =====
+管理ノードと計算ノードの間の通信はSSHで行います。
+  * 現状のままだと管理ノードから計算ノードへ入る際にパスワードの入力が必要ですが、ジョブ投入のたびにパスワードを入力するのは現実的ではありません。
+  * そこでパスフレーズなしのSSH鍵を作成することで、パスワードの入力を回避します
+  - 管理ノードのジョブを投げるユーザーのアカウント（以下ではsugimotoとします）にログインし、SSH鍵を作成します。パスフレーズを聞かれるところでは、**なにも入力せずに**エンターを押します<code>
+$ ssh-keygen -t rsa
+Generating public/private rsa key pair.
+Enter file in which to save the key (/home/sugimoto/.ssh/id_rsa):
+Created directory '/home/sugimoto/.ssh'.
+Enter passphrase (empty for no passphrase):
+Enter same passphrase again:
+Your identification has been saved in /home/sugimoto/.ssh/id_rsa.
+Your public key has been saved in /home/sugimoto/.ssh/id_rsa.pub.
+The key fingerprint is:
+SHA256:ZLnV/uJ8+lml7EdU+j8sjGJdxqF6F+tyg8FrD2hP3hI sugimoto@kanri
+The key's randomart image is:
++---[RSA 2048]----+
+|                 |
+|         . .    .|
+|        + . .  ..|
+|       o o . .. .|
+|        S . + .o.|
+|          .E B .+|
+|         ooo@ B.o|
+|        .++%oX.=o|
+|        . +o@B*..|
++----[SHA256]-----+
+</code>
+  - 公開鍵を設置します<code>
+$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
+</code>
+    * NFSサーバを設置しているので、管理ノードにおいてある鍵は計算ノードでも見えます
+  - 初回接続時に表示されるメッセージを抑制させます<code>
+$ echo "StrictHostKeyChecking no" >> ~/.ssh/config
+</code>
+  - 権限を変更します<code>
+$ chmod 600 ~/.ssh/id_rsa
+$ chmod 600 ~/.ssh/authorized_keys
+$ chmod 700 ~/.ssh/
+</code>
+  - 実際にパスワード無しで計算ノードにログインできるか確かめます<code>
+$ ssh keisan11
+</code>
 ====== 並列計算 ======
@@ Line 34: / Line 81: @@
 次のコードを使って説明します
-<file - test.c>
+<file - hello.c>
 #include <stdio.h>
-#include <mpi.h>
+#include "mpi.h"
-int main(int argc, char **argv) {
+int main( int argc, char *argv[] )
+{
     int     rank, size, len;
     char    name[MPI_MAX_PROCESSOR_NAME];
@@ Line 47: / Line 95: @@
     MPI_Get_processor_name( name, &len );
     name[len] = '\0';
-    printf( "I am %d of %d from %s\n", rank, size, name );
-    MPI_Barrier( MPI_COMM_WORLD );
+    printf( "Hello World! I am %d of %d from %s.\n", rank, size, name );
-    MPI_Finalize();
+    MPI_Finalize();
     return 0;
 }
@@ Line 56: / Line 104: @@
   * プログラムのコンパイルは次のようにします<code>
-$ mpicc test.c
+$ mpicc -o hello hello.c
+$ mpiicc -o hello hello.c   # Intel MPIを使用する場合
 </code>
+  * 試しに管理ノードで走らせてみます<code>
+$ mpirun -n 4 hello
+Hello World! I am 0 of 4 from kanri.
+Hello World! I am 1 of 4 from kanri.
+Hello World! I am 2 of 4 from kanri.
+Hello World! I am 3 of 4 from kanri.
+</code>
+===== ノード内並列計算 =====
+指定した計算ノードにジョブを投げてみます。
+  * MPIで指定のホストに投げる場合は、オプション<nowiki>--host</nowiki>でホスト名を指定します
+  * 計算ノードのkeisan11にジョブを投げる場合は次のようにします<code>
+$ mpirun -n 24 --host keisan11 hello
+Hello World! I am 0 of 24 from keisan11.
+Hello World! I am 1 of 24 from keisan11.
+Hello World! I am 2 of 24 from keisan11.
+Hello World! I am 3 of 24 from keisan11.
+（以下略）
+</code>
+===== ノード間並列計算 =====
+複数の計算ノードにわたるジョブを投げてみます。
+  * オプション<nowiki>--host</nowiki>で複数のホスト名を指定します
+  * 計算ノードkeisan11とkeisan12にジョブを投げる場合は次のようにします<code>
+$ mpirun -n 4 --host keisan11,keisan12 hello
+Hello World! I am 0 of 4 from keisan11.
+Hello World! I am 1 of 4 from keisan11.
+Hello World! I am 2 of 4 from keisan12.
+Hello World! I am 3 of 4 from keisan12.
+</code>
+    * MPIが各ノードに自動的にプロセスを割り振ります
+    * 並列計算におけるスレッド間の通信を考えたとき、ノード間の通信はノード内の通信に比べて非常に遅いです。できるだけ通信をしないようなプログラムが要求されます。
+====== 参考 ======
+  * https://www.hpci-office.jp/pages/seminar_texts

雑多な記録

User Tools

Site Tools

Differences

Page Tools