maddux(192.168.2.6)
1 nodeに64コアあり、全部で4 nodes.
コンパイラはpgi; 並列化はOpen mpi.
/usr/mpi/pgi/openmpi-1.4.3/bin/ の下のmpicc,mpif90,mpirunなどを使って下さい。(絶対パスを設定しなくてはいけない場合もあるみたい。)
並列コンパイルはfortran,Cそれぞれmpif90,mpiccを使用.
job管理は、qsub系のtorqueが導入されている。
例えば以下のようなスクリプト test.sh を作成する。
#!/bin/sh
#PBS -l nodes=2:ppn=32 ## 1 node当たり32コアで2 nodes
#PBS -l ncpus=64 ## 上記のnodesとppnの積(これを省略すると全コア占有してしまうようなので必ず付けて下さい)
#PBS -q madduxA ## queue名(jobカテゴリ 現在はmadduxAのみ)
#PBS -N test ## job名
echo Working Directory is $PBS_P_WORKDIR
cd $PBS_O_WORKDIR
NPROCS=`wc -l <$PBS_NODEFILE`
mpirun -machinefile $PBS_NODEFILE -np $NPROCS ./a.out > tmp.log
そして
qsub test.sh
でjobを投入。jobの消去はqdel,jobやqueue状態の確認はqstat,nodesの状態の表示
はpbsnodes を使用する。
jobクラスは現在madduxAのみで、最大経過時間(Wall Time)は24時間なので、長時間計算
をしたい場合でも24時間以内で一旦終了させ、つないでいくこと。
jobの連結は上記のシェルスクリプトを上手く利用するか,qsubのオプションで可能.