User Tools

Site Tools


torque:ぼっちtorque

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
torque:ぼっちtorque [2017/10/16 19:46]
koudai
torque:ぼっちtorque [2021/06/27 22:04] (current)
Line 6: Line 6:
 以下ではホスト名をuser-pcとします。 以下ではホスト名をuser-pcとします。
  
->$ sudo vi /etc/hosts+<code> 
 +$ sudo vi /etc/hosts 
 +</code>
  
 (変更前) (変更前)
Line 24: Line 26:
 変更を反映させるにはコンピュータの再起動が必要です。 変更を反映させるにはコンピュータの再起動が必要です。
  
->$ sudo reboot +<code> 
 +$ sudo reboot 
 +</code>
  
 ====== Torqueのインストール ====== ====== Torqueのインストール ======
Line 31: Line 34:
 端末を開いて、aptによりtorqueをインストールします。 端末を開いて、aptによりtorqueをインストールします。
  
->$ sudo apt install torque-server torque-mom+<code> 
 +$ sudo apt install torque-server torque-mom 
 +</code>
  
 torque-clientはtorque-serverに含まれているので、ヘッドノードと計算ノードが同じ場合はインストール不要です。 torque-clientはtorque-serverに含まれているので、ヘッドノードと計算ノードが同じ場合はインストール不要です。
Line 40: Line 45:
 インストールするとTorqueが動き出すので、いったん終了させておきます。 インストールするとTorqueが動き出すので、いったん終了させておきます。
  
->\$ ps -e |grep pbs +<code> 
-1407 ?        00:00:00 pbs_sched +$ ps -e |grep pbs 
-1611 ?        00:00:00 pbs_mom + 1407 ?        00:00:00 pbs_sched 
-1618 ?        00:00:00 pbs_server + 1611 ?        00:00:00 pbs_mom 
->\$sudo kill 1407 1611 1618  + 1618 ?        00:00:00 pbs_server 
 +$ sudo kill 1407 1611 1618  
 +</code>
  
 /etc/torque/server_nameにホスト名を書き込みます。 /etc/torque/server_nameにホスト名を書き込みます。
->$ sudo vi /etc/torque/server_name+ 
 +<code> 
 +$ sudo vi /etc/torque/server_name 
 +</code> 
 <file - server_name> <file - server_name>
 user-pc user-pc
Line 56: Line 66:
 ジョブサーバーのpbs_serverを起動します。 ジョブサーバーのpbs_serverを起動します。
  
->\$ sudo pbs_server -t create +<code> 
->PBS_Server foo6134: Create mode and server database exists, +$ sudo pbs_server -t create 
->do you wish to continue y/(n)?y+PBS_Server foo6134: Create mode and server database exists, 
 +do you wish to continue y/(n)?y 
 +</code>
  
 +pbs_serverが起動したら/var/spool/torque/server_priv/にnodesというファイルを作り、使用できる最大プロセス数を指定します。
 +
 +<code>
 +$ sudo vi /var/spool/torque/server_priv/nodes
 +</code>
  
-pbs_serverが起動したら/var/spool/torque/server_priv/にnodesというファイルを作り、使用できる最大プロセス数を指定します。 
->\$ sudo vi /var/spool/torque/server_priv/nodes 
 <file - nodes> <file - nodes>
-localhost np=32+user-pc np=32
 </file> </file>
 npで一度に実行できるプロセスの最大数を指定します。 npで一度に実行できるプロセスの最大数を指定します。
 最大プロセス数は 最大プロセス数は
->\$ cpuinfo+<code> 
 +$ cpuinfo 
 +</code> 
 でProcessors(CPUs)の後ろにある数字から確認できます。 でProcessors(CPUs)の後ろにある数字から確認できます。
  
 なお、このnodesというファイルは なお、このnodesというファイルは
->\$ sudo pbs_server -t create+<code> 
 +$ sudo pbs_server -t create 
 +</code>
 を再び実行すると削除されます。 を再び実行すると削除されます。
  
 ディレクトリのパーミッションを変更します。 ディレクトリのパーミッションを変更します。
  
->\$ sudo chmod 777 /var/spool/torque/spool /var/spool/torque/undelivered +<code> 
->\$ chmod o+t /var/spool/torque/spool /var/spool/torque/undelivered +$ sudo chmod 777 /var/spool/torque/spool /var/spool/torque/undelivered 
 +$ chmod o+t /var/spool/torque/spool /var/spool/torque/undelivered 
 +</code>
  
 以上の設定が終わったら、コンピュータを再起動します(ノードを設定したファイルはTorque起動時に読み込まれるため)。 以上の設定が終わったら、コンピュータを再起動します(ノードを設定したファイルはTorque起動時に読み込まれるため)。
  
->\$ sudo reboot+<code> 
 +$ sudo reboot 
 +</code>
  
 設定されたノードの情報は 設定されたノードの情報は
->\$ pbsnodes+<code> 
 +$ pbsnodes 
 +</code>
 で確認できます。 で確認できます。
  
Line 102: Line 127:
 以下では必要最低限の設定をしています。 以下では必要最低限の設定をしています。
  
->\$ sudo qmgr +<code> 
->Max open servers: xxx +$ sudo qmgr 
->Qmgr: set server scheduling=true  スケジューリングを有効にします。これが有効になってないとTorqueを使う意味がない。 +Max open servers: xxx 
->Qmgr: create queue batch queue_type=execution  batchという名前のキューを作ります。 +Qmgr: set server scheduling=true  スケジューリングを有効にします。これが有効になってないとTorqueを使う意味がない。 
->Qmgr: set queue batch started=true  batchでのジョブの実行を許可します。 +Qmgr: create queue batch queue_type=execution  batchという名前のキューを作ります。 
->Qmgr: set queue batch enabled=true  batchにジョブを受け入れられるようにします。 +Qmgr: set queue batch started=true  batchでのジョブの実行を許可します。 
->Qmgr: set queue batch resources_default.nodes=1  batchに割り当てられるノードの数。ぼっちTorqueなのでノード数は必然的に1 +Qmgr: set queue batch enabled=true  batchにジョブを受け入れられるようにします。 
->Qmgr: set queue batch resources_default.walltime=240:00:00  ジョブの最大実行時間。この場合は240時間  +Qmgr: set queue batch resources_default.nodes=1  batchに割り当てられるノードの数。ぼっちTorqueなのでノード数は必然的に1 
->Qmgr: set server default_queue=batch  ジョブ投入時に特に指定がなければbatchに入る +Qmgr: set queue batch resources_default.walltime=240:00:00  ジョブの最大実行時間。この場合は240時間  
->Qmgr: exit  キューの管理を終了する+Qmgr: set server default_queue=batch  ジョブ投入時に特に指定がなければbatchに入る 
 +Qmgr: exit  キューの管理を終了する 
 +</code>
  
 あるいはqmgrを起動しなくても あるいはqmgrを起動しなくても
->\$sudo qmgr -c "set server scheduling=true"+<code> 
 +$sudo qmgr -c "set server scheduling=true" 
 +</code>
 で設定可能です。 で設定可能です。
  
 設定の削除は次のようにします。 設定の削除は次のようにします。
- +<code> 
->Qmgr: unset server scheduling=true+Qmgr: unset server scheduling=true 
 +</code>
  
 batchという名前のキューの削除は次のようにします。 batchという名前のキューの削除は次のようにします。
- +<code> 
->Qmgr: delete queue batch +Qmgr: delete queue batch 
 +</code>
 設定の確認は次のようにします。 設定の確認は次のようにします。
- +<code> 
->Qmgr: p s +Qmgr: p s 
 +</code>
  
  
Line 135: Line 165:
  
 Torqueがちゃんと動作しているかは Torqueがちゃんと動作しているかは
->\$ echo 'sleep 30' | qsub +<code> 
->\$ qstat+$ echo 'sleep 30' | qsub 
 +$ qstat 
 +</code>
 で確認してください。 で確認してください。
  
torque/ぼっちtorque.1508150784.txt.gz · Last modified: 2021/06/27 22:00 (external edit)