User Tools

Site Tools


torque:ぼっちtorque

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
torque:ぼっちtorque [2017/09/02 19:22]
koudai [キューの設定]
torque:ぼっちtorque [2021/06/27 22:04] (current)
Line 3: Line 3:
 ====== 準備 ====== ====== 準備 ======
  
-/etc/hostsを開いて、localhostとホスト名(コンピュータ名)のIPアドレスを同じにしておきます。+/etc/hostsを開いて、ホスト名(コンピュータ名)のIPアドレスをlocalhostのものと同じにしておきます。
 以下ではホスト名をuser-pcとします。 以下ではホスト名をuser-pcとします。
  
->$ sudo vi /etc/hosts+<code> 
 +$ sudo vi /etc/hosts 
 +</code>
  
 (変更前) (変更前)
 <file - hosts> <file - hosts>
 127.0.0.1 localhost 127.0.0.1 localhost
-127.0.0.1 user-pc+127.0.1.1 user-pc
 # 以下略 # 以下略
 </file> </file>
Line 22: Line 24:
 </file> </file>
  
-ホスト名の変更を反映させるにはコンピュータの再起動が必要です。 +変更を反映させるにはコンピュータの再起動が必要です。
- +
->$ sudo reboot+
  
 +<code>
 +$ sudo reboot
 +</code>
  
 ====== Torqueのインストール ====== ====== Torqueのインストール ======
Line 31: Line 34:
 端末を開いて、aptによりtorqueをインストールします。 端末を開いて、aptによりtorqueをインストールします。
  
->$ sudo apt install torque-server torque-mom+<code> 
 +$ sudo apt install torque-server torque-mom 
 +</code>
  
 torque-clientはtorque-serverに含まれているので、ヘッドノードと計算ノードが同じ場合はインストール不要です。 torque-clientはtorque-serverに含まれているので、ヘッドノードと計算ノードが同じ場合はインストール不要です。
Line 38: Line 43:
 ====== Torqueの設定 ====== ====== Torqueの設定 ======
  
-/etc/torque/server_nameにlocalhost(ホスト名でも可。以下同様)と書き込みます。 +インストールするとTorqueが動き出すので、いったん終了させておきます。 
->$ sudo vi /etc/torque/server_name+ 
 +<code> 
 +$ ps -e |grep pbs 
 + 1407 ?        00:00:00 pbs_sched 
 + 1611 ?        00:00:00 pbs_mom 
 + 1618 ?        00:00:00 pbs_server 
 +$ sudo kill 1407 1611 1618  
 +</code> 
 + 
 +/etc/torque/server_nameにホスト名書き込みます。 
 + 
 +<code> 
 +$ sudo vi /etc/torque/server_name 
 +</code> 
 <file - server_name> <file - server_name>
-localhost+user-pc
 </file> </file>
  
Line 47: Line 66:
 ジョブサーバーのpbs_serverを起動します。 ジョブサーバーのpbs_serverを起動します。
  
->\$ sudo pbs_server -t create +<code> 
->PBS_Server foo6134: Create mode and server database exists, +$ sudo pbs_server -t create 
->do you wish to continue y/(n)?y +PBS_Server foo6134: Create mode and server database exists, 
 +do you wish to continue y/(n)?y 
 +</code>
  
 pbs_serverが起動したら/var/spool/torque/server_priv/にnodesというファイルを作り、使用できる最大プロセス数を指定します。 pbs_serverが起動したら/var/spool/torque/server_priv/にnodesというファイルを作り、使用できる最大プロセス数を指定します。
->\$ sudo vi /var/spool/torque/server_priv/nodes+ 
 +<code> 
 +$ sudo vi /var/spool/torque/server_priv/nodes 
 +</code> 
 <file - nodes> <file - nodes>
-localhost np=32+user-pc np=32
 </file> </file>
 npで一度に実行できるプロセスの最大数を指定します。 npで一度に実行できるプロセスの最大数を指定します。
 最大プロセス数は 最大プロセス数は
->\$ cpuinfo+<code> 
 +$ cpuinfo 
 +</code> 
 でProcessors(CPUs)の後ろにある数字から確認できます。 でProcessors(CPUs)の後ろにある数字から確認できます。
  
 なお、このnodesというファイルは なお、このnodesというファイルは
->\$ sudo pbs_server -t create+<code> 
 +$ sudo pbs_server -t create 
 +</code>
 を再び実行すると削除されます。 を再び実行すると削除されます。
  
 +ディレクトリのパーミッションを変更します。
  
-以上の設定が終わったら、Torqueを再起動します(ノードを設定したファイルはTorque起動時に読み込まれるため)。+<code> 
 +$ sudo chmod 777 /var/spool/torque/spool /var/spool/torque/undelivered 
 +$ chmod o+t /var/spool/torque/spool /var/spool/torque/undelivered 
 +</code>
  
->$ sudo service torque-server restart +以上の設定が終わったら、コンピュータを再起動します(ノードを設定したファイルはTorque起動時に読み込まれるため)。 
->$ sudo service torque-scheduler restart + 
->$ sudo service torque-mom restart+<code
 +$ sudo reboot 
 +</code>
  
 設定されたノードの情報は 設定されたノードの情報は
->$ pbsnodes+<code> 
 +$ pbsnodes 
 +</code>
 で確認できます。 で確認できます。
  
Line 87: Line 124:
  
 以下ではbatchという名前のキューを作ります。 以下ではbatchという名前のキューを作ります。
-キューの設定は管理者権限でqmgrを起動し set [server|queue 設定するキュー名] <設定内容>行います。+キューの設定は管理者権限でqmgrを起動し行います。
 以下では必要最低限の設定をしています。 以下では必要最低限の設定をしています。
  
->\$ sudo qmgr +<code> 
->Max open servers: xxx +$ sudo qmgr 
->Qmgr: set server scheduling=true スケジューリングを有効にします。これが有効になってないとTorqueを使う意味がない。 +Max open servers: xxx 
->Qmgr: create queue batch queue_type=execution batchという名前のキューを作ります。 +Qmgr: set server scheduling=true  スケジューリングを有効にします。これが有効になってないとTorqueを使う意味がない。 
->Qmgr: set queue batch started=true batchでのジョブの実行を許可します。 +Qmgr: create queue batch queue_type=execution  batchという名前のキューを作ります。 
->Qmgr: set queue batch enabled=true batchにジョブを受け入れられるようにします。 +Qmgr: set queue batch started=true  batchでのジョブの実行を許可します。 
->Qmgr: set queue batch resources_default.nodes=1 batchに割り当てられるノードの数。ぼっちTorqueなのでノード数は必然的に1 +Qmgr: set queue batch enabled=true  batchにジョブを受け入れられるようにします。 
->Qmgr: set queue batch resources_default.walltime=240:00:00 ジョブの最大実行時間。この場合は240時間  +Qmgr: set queue batch resources_default.nodes=1  batchに割り当てられるノードの数。ぼっちTorqueなのでノード数は必然的に1 
->Qmgr: set server default_queue=batch ジョブ投入時に特に指定がなければbatchに入る +Qmgr: set queue batch resources_default.walltime=240:00:00  ジョブの最大実行時間。この場合は240時間  
->Qmgr: exit 設定を終了する+Qmgr: set server default_queue=batch  ジョブ投入時に特に指定がなければbatchに入る 
 +Qmgr: exit  キューの管理を終了する 
 +</code>
  
 あるいはqmgrを起動しなくても あるいはqmgrを起動しなくても
->\$sudo qmgr -c "set server scheduling=true"+<code> 
 +$sudo qmgr -c "set server scheduling=true" 
 +</code>
 で設定可能です。 で設定可能です。
  
 設定の削除は次のようにします。 設定の削除は次のようにします。
 +<code>
 +Qmgr: unset server scheduling=true
 +</code>
  
->Qmgr: unset server scheduling=true +batchという名前のキューの削除は次のようにします。 
- +<code> 
-キューの削除は次のようにします。 +Qmgr: delete queue batch 
- +</code>
->\$ sudo qmgr -c "delete queue batch" キューbatchを削除します。 +
 設定の確認は次のようにします。 設定の確認は次のようにします。
- +<code> 
->\$ qmgr -c "p s" +Qmgr: p s 
 +</code>
  
  
Line 123: Line 165:
  
 Torqueがちゃんと動作しているかは Torqueがちゃんと動作しているかは
->\$ echo 'sleep 30' | qsub +<code> 
->\$ qstat+$ echo 'sleep 30' | qsub 
 +$ qstat 
 +</code>
 で確認してください。 で確認してください。
  
torque/ぼっちtorque.1504347778.txt.gz · Last modified: 2021/06/27 22:00 (external edit)