User Tools

Site Tools


自作クラスタ計算機:mpiによる並列計算

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
自作クラスタ計算機:mpiによる並列計算 [2020/03/02 16:48]
koudai [サンプルプログラム]
自作クラスタ計算機:mpiによる並列計算 [2020/03/03 15:37]
koudai [通常の使い方]
Line 2: Line 2:
  
   * 実際にMPIを用いたノード内およびノード間の並列計算を行います   * 実際にMPIを用いたノード内およびノード間の並列計算を行います
-  * 事前にOpenMPIMPICH2などのMPIライブラリを管理ノードにインストールしてください +  * 事前にOpenMPIMPICH2, Intel MPIなどのMPIライブラリを管理ノードにインストールしてください 
-  * 例えばOpenMPIであれば次のようにインストールできす<code>+  * OpenMPIの場合、次のようにaptで簡単にインストールできるので、特にこだわりがなければお勧めです<code>
 $ sudo apt install openmpi-bin libopenmpi-dev $ sudo apt install openmpi-bin libopenmpi-dev
 </code> </code>
 +  * **複数のMPIを一つのコンピュータに入れると、競合を起こしてMPIが動かなくなります**
  
 ====== 準備 ====== ====== 準備 ======
 +
 +===== ハードウェアの確認 =====
  
 事前に各ノードのCPUのコア数(物理コア数)とスレッド数(論理コア数)を確認してください 事前に各ノードのCPUのコア数(物理コア数)とスレッド数(論理コア数)を確認してください
Line 23: Line 25:
  
  
 +===== SSHの導入 =====
 +
 +管理ノードと計算ノードの間の通信はSSHで行います。
 +  * 現状のままだと管理ノードから計算ノードへ入る際にパスワードの入力が必要ですが、ジョブ投入のたびにパスワードを入力するのは現実的ではありません。
 +  * そこでパスフレーズなしのSSH鍵を作成することで、パスワードの入力を回避します
 +
 +  - 管理ノードのジョブを投げるユーザーのアカウント(以下ではsugimotoとします)にログインし、SSH鍵を作成します。パスフレーズを聞かれるところでは、**なにも入力せずに**エンターを押します<code>
 +$ ssh-keygen -t rsa
 +Generating public/private rsa key pair.
 +Enter file in which to save the key (/home/sugimoto/.ssh/id_rsa): 
 +Created directory '/home/sugimoto/.ssh'.
 +Enter passphrase (empty for no passphrase): 
 +Enter same passphrase again: 
 +Your identification has been saved in /home/sugimoto/.ssh/id_rsa.
 +Your public key has been saved in /home/sugimoto/.ssh/id_rsa.pub.
 +The key fingerprint is:
 +SHA256:ZLnV/uJ8+lml7EdU+j8sjGJdxqF6F+tyg8FrD2hP3hI sugimoto@kanri
 +The key's randomart image is:
 ++---[RSA 2048]----+
 +|                 |
 +|         . .    .|
 +|        + . .  ..|
 +|       o o . .. .|
 +|        S . + .o.|
 +|          .E B .+|
 +|         ooo@ B.o|
 +|        .++%oX.=o|
 +|        . +o@B*..|
 ++----[SHA256]-----+
 +</code>
 +  - 公開鍵を設置します<code>
 +$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
 +</code>
 +    * NFSサーバを設置しているので、管理ノードにおいてある鍵は計算ノードでも見えます
 +  - 初回接続時に表示されるメッセージを抑制させます<code>
 +$ echo "StrictHostKeyChecking no" >> ~/.ssh/config
 +</code>
 +  - 権限を変更します<code>
 +$ chmod 600 ~/.ssh/id_rsa
 +$ chmod 600 ~/.ssh/authorized_keys
 +$ chmod 700 ~/.ssh/
 +</code>
 +  - 実際にパスワード無しで計算ノードにログインできるか確かめます<code>
 +$ ssh keisan11
 +</code>
  
 ====== 並列計算 ====== ====== 並列計算 ======
Line 49: Line 96:
     name[len] = '\0';     name[len] = '\0';
          
-    printf( "Hello World! I am %d of %d from %s.\n", rank, size, name );+    printf( "Hello world: rank %d of %d running on %s\n", rank, size, name );
  
     MPI_Finalize();     MPI_Finalize();
Line 60: Line 107:
 $ mpiicc -o hello hello.c   # Intel MPIを使用する場合 $ mpiicc -o hello hello.c   # Intel MPIを使用する場合
 </code> </code>
-  * 管理ノード(4スレッド)で走らせてみます<code> +  * 試しに管理ノードで走らせてみます<code> 
-$ mpirun -n 4 hello +$ mpirun -n 4 ./hello 
-Hello World! I am 0 of 4 from kanri. +Hello world: rank 0 of 4 running on kanri 
-Hello World! I am 1 of 4 from kanri. +Hello world: rank 1 of 4 running on kanri 
-Hello World! I am 2 of 4 from kanri. +Hello world: rank 2 of 4 running on kanri 
-Hello World! I am 3 of 4 from kanri.+Hello world: rank 3 of 4 running on kanri
 </code> </code>
  
 +
 +
 +===== ノード内並列計算 =====
 +
 +指定した計算ノードにジョブを投げてみます。
 +
 +  * MPIで指定のホストに投げる場合は、オプション<nowiki>-hosts</nowiki>でホスト名を指定します
 +  * 計算ノードのkeisan11にジョブを投げる場合は次のようにします<code>
 +$ mpirun -n 8 -hosts keisan11 ./hello
 +Hello world: rank 0 of 8 running on keisan11
 +Hello world: rank 1 of 8 running on keisan11
 +Hello world: rank 2 of 8 running on keisan11
 +Hello world: rank 3 of 8 running on keisan11
 +Hello world: rank 4 of 8 running on keisan11
 +Hello world: rank 5 of 8 running on keisan11
 +Hello world: rank 6 of 8 running on keisan11
 +Hello world: rank 7 of 8 running on keisan11
 +</code>
 +
 +
 +===== ノード間並列計算 =====
 +
 +==== 通常の使い方 ====
 +
 +複数の計算ノードにわたるジョブを投げてみます。
 +
 +  * オプション<nowiki>-hosts</nowiki>で複数のホスト名を指定します
 +  * 計算ノードkeisan11, keisan12, keisan13にジョブを投げる場合は次のようにします<code>
 +$ mpirun -n 10 -hosts keisan11,keisan12,keisan13 ./hello
 +Hello world: rank 0 of 10 running on keisan11
 +Hello world: rank 1 of 10 running on keisan11
 +Hello world: rank 2 of 10 running on keisan11
 +Hello world: rank 3 of 10 running on keisan11
 +Hello world: rank 4 of 10 running on keisan12
 +Hello world: rank 5 of 10 running on keisan12
 +Hello world: rank 6 of 10 running on keisan12
 +Hello world: rank 7 of 10 running on keisan12
 +Hello world: rank 8 of 10 running on keisan13
 +Hello world: rank 9 of 10 running on keisan13
 +</code>
 +  * どうやら管理ノードのプロセス数だけ投げたら次のノードに行く、という仕組みみたいです。(未確認)
 +
 +==== ホストファイルによるジョブの投入 ====
 +
 +例えば計算ノードによって性能に差がある場合など、ノードごとのプロセス数を自分で管理したい場合はホストファイルを作成します。
 +
 +  * MPICH, Intel MPIの場合
 +<file - my_hosts>
 +keisan11:2
 +keisan12:3
 +</file>
 +  * OpenMPIの場合
 +<file - my_hosts>
 +keisan11 slots=2
 +keisan12 slots=3
 +</file>
 +
 +次のように実行します
 +<code>
 +$ mpirun -n 6 -f my_hosts ./hello
 +Hello World; rank 0 of 6 running on keisan11.
 +Hello World! I am 1 of 6 from keisan11.
 +Hello World! I am 2 of 6 from keisan12.
 +Hello World! I am 3 of 6 from keisan12.
 +Hello World! I am 4 of 6 from keisan12.
 +Hello World! I am 5 of 6 from keisan11.
 +</code>
 +    * プロセスは keisan11 -> keisan11 -> keisan12 -> keisan12 -> keisan12 -> keisan11 -> keisan11 -> keisan12 -> keisan12 -> keisan12 -> keisan11 -> ... の順に割り振られて行きます
 +    * Intel MPIの場合は<nowiki>-f</nowiki>の代わりに<nowiki>-machinefile</nowiki>あるいは<nowiki>-machine</nowiki>を使用してください
 +      * https://software.intel.com/en-us/articles/controlling-process-placement-with-the-intel-mpi-library 
  
 ====== 参考 ====== ====== 参考 ======
自作クラスタ計算機/mpiによる並列計算.txt · Last modified: 2023/12/26 23:43 by koudai