日記

研究日誌,日々の雑感,ノロケ

IFERC-CSC / M100 でMPI計算をする場合のバッチファイルのオプション(without OpenMP)

OpenMPを用いないので,1core/task。taskは多いほどよい。

CSCの場合

f:id:gogasya:20220113163645p:plain
CSCのマニュアル

物理コア:40cores/node HT:2HT/core 仕様可能なオプション:--ntasks, --cpu-per-task

max 1) dev (max 8 nodes or 160cores)

#SBATCH --ntasks=80
#SBATCH --cpus-per-task=2 #HTを考慮

-> 要求は160 threads -> 80 physical cores -> 2 nodes

max 2) S-M (max 640 nodes or 1280 cores)

#SBATCH --ntasks=1280
#SBATCH --cpus-per-task=2 #HTを考慮

-> 要求は2560 threads -> 1280 physical cores -> 32 nodes

max 3) Large (max 512 nodes)

#SBATCH --ntasks=1280
#SBATCH --cpus-per-task=2 #HTを考慮

-> 要求は40960 threads -> 20480 physical cores -> 512 nodes

M100の場合

f:id:gogasya:20220113164757p:plain
Introduction to M100より

物理コア:32cores/node HT:4HT/core 仕様可能なオプション:--nodes, --ntasks-per-node, --cpu-per-task

max 1) qos指定なし (max 16 nodes)

#SBATCH --nodes=16
#SBATCH --ntasks-per-node=32 #dont change this parameter
#SBATCH --cpus-per-task=4 #HTを考慮
mpirun -np 512

-> 要求は16324=2048 threads -> 512 physical cores -> 16 nodes

max 2) qos指定あり(max 32 nodes)

#SBATCH --nodes=32
#SBATCH --ntasks-per-node=32
#SBATCH --cpus-per-task=4 #HTを考慮
#SBATCH --qos="m100_qos_fuabprod"
mpirun -np 1024

-> 要求は32324= 4096threads -> 1024 physical cores -> 32 nodes