VU MIF VSL STSC
Skaitmeninių tyrimų ir skaičiavimų centras, Virtualių skaičiavimų laboratorija
Naujienos
Dažnos problemos
Studentams
Darbuotojams
Administratoriams
Naudotojų sąrašai
Programų sąrašai
Debesų kompiuterija
Skaičiavimų tinklas
Microsoft Imagine
Belaidis tinklas
Kompiuterių tinklas
Budėjimo grafikas
Esant problemoms VU MIF kompiuterių tinkle rašykite adresu:
pagalba@mif.vu.lt .

 

OpenMPI


Debian distribucijoje OpenMPI palaiko procesų paleidimą per Slurm.

Neleiskite MPI užduočių telkinyje alpha jeigu skaičiavimų metu bus apsikeičiama daug duomenų, nes ten MPI gali naudoti tik 1Gbit/s tinklą.

mpirun ir mpiexec yra programos, kurios realiai vykdo Slurm'o srun ir palaiko nevisus OpenMPI procesų paleidimo scenarijus (SPMD turėtų veikti be problemų).

Jeigu jums reikia originalių OpenMPI paleidimo programų, jos yra mpirun.openmpi ir mpiexec.openmpi, bet jos užduotyje paleidžia procesus per vieną paleidėją kiekviename mazge, todėl tai efektyviai veiks tik kai nurodysite Slurm paleisti po vieną užduotį kiekviename mazge su visais to mazgo procesoriais
pvz: sbatch -N2 -n2 -c12 -C beta mpi_job.

Daugiau informacijos apie OpenMPI kurėjų puslapyje.


Tipiškas darbo su OpenMPI scenarijus

$ ssh rona1043@uosis.mif.vu.lt
rona1043@uosis.mif.vu.lt's password: 
Linux linux4 2.6.32-5-xen-amd64 #1 SMP Mon Jan 16 20:48:30 UTC 2012 x86_64
...
Last login: Fri Mar  9 14:49:50 2012 from matrix.mif
rona1043@linux4:~$ klist
Ticket cache: FILE:/tmp/krb5cc_11043_o28366
Default principal: rona1043@MIF

Valid starting     Expires            Service principal
03/10/12 10:35:26  03/11/12 10:35:12  krbtgt/MIF@MIF
rona1043@linux4:~$ ssh cluster
Linux lxibm102 2.6.32-5-amd64 #1 SMP Mon Jan 16 16:22:28 UTC 2012 x86_64
...
Last login: Fri Mar  9 15:07:01 2012 from linux4.mif
rona1043@lxibm102:~$ mkdir testas
rona1043@lxibm102:~$ cd testas
rona1043@lxibm102:~/testas$ cp /scratch/lustre/test/openmpi/hello.c .
rona1043@lxibm102:~/testas$ cp /scratch/lustre/test/openmpi/hello.sh .
rona1043@lxibm102:~/testas$ ls -l
total 0
-rw-r--r-- 1 rona1043 rona1043 561 Mar 10 10:51 hello.c
-rw-r--r-- 1 rona1043 rona1043  75 Mar 10 10:51 hello.sh
rona1043@lxibm102:~/testas$ cat hello.sh
#!/bin/sh
#SBATCH -p short
#SBATCH -n4
mpicc -o hello hello.c
mpirun hello
rona1043@lxibm102:~/testas$ sbatch hello.sh
Submitted batch job 234
rona1043@lxibm102:~/testas$ squeue
  JOBID PARTITION     NAME     USER  ST       TIME  NODES NODELIST(REASON)
rona1043@lxibm102:~/testas$ ls -l
total 24
-rwxr-xr-x 1 rona1043 rona1043 9297 Mar 10 10:52 hello
-rw-r--r-- 1 rona1043 rona1043  561 Mar 10 10:51 hello.c
-rw-r--r-- 1 rona1043 rona1043   75 Mar 10 10:51 hello.sh
-rw-r--r-- 1 rona1043 rona1043  156 Mar 10 10:52 slurm-234.out
rona1043@lxibm102:~/testas$ cat slurm-234.out
Hello world! from processor 0 out of 4
Hello world! from processor 2 out of 4
Hello world! from processor 1 out of 4
Hello world! from processor 3 out of 4
rona1043@lxibm102:~/testas$ logout
Connection to cluster closed.
rona1043@linux4:~$ logout
Connection to uosis.mif.vu.lt closed.

Hello world programos tekstą ir skripto failą galite rasti /scratch/lustre/test/openmpi kataloge.


Nuorodos

Pastaba. Dalis informacijos šiuose puslapiuose prieinama tik VU MIF kompiuterių tinklo naudotojams, pateikusiems savo VU MIF naudotojo vardą ir slaptažodį.
© 1999 - 2017 VU MIF Skaitmeninių tyrimų ir skaičiavimo centras