|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Turinys
Įrangos aprašymasPaskirstytų skaičiavimų tinklas (PST) yra specialiai paruoštas kompiuterių tinklas, kuriame yra galimybė vykdyti programas, kurios galėtų efektyviai apsikeisti duomenimis. VU MIF PST sudaro superkompiuteris iš telkinių (pirmas skaičius - faktiškai pasiekiamas kiekis):
Skaičiavimo mazgų ypatybės:
Toliau tekste procesorius = CPU = core - procesoriaus vienas branduolys (su visomis hypergijomis, jei jos yra įjungtos). Nenaudojami skaičiavimo mazgai yra išjungiami, tai užduočių startavimas gali užtrūkti ~5-10min. Skaičiavimo mazgai yra įjungiami po vieną per minutę. Programinė įrangaPST yra instaliuota Debian operacinė sistema (OS) su Linux branduoliu. Joje instaliuoti tokie paketai (ir dar daugiau):
RegistracijaPST gali naudotis tik registruoti VU MIF kompiuterių tinklo naudotojai.
Esami VU MIF tinklo naudotojai PST gali naudotis (eilėje short) be papildomos registracijos. PrisijungimasNorint prisijungti prie PST reikia naudoti SSH programas (ssh, putty, winscp, mobaxterm) ir Kerberos arba SSH raktų autentikaciją. Jeigu naudojate Kerberos:
Jeigu naudojate SSH raktus (pvz: jei norite kopijuoti didelius failus):
VU MIF PST failų sistemosVU MIF PST bendra failų sistema (Lustre)VU MIF PST bendra failų sistema yra pasiekiama /scratch/lustre kataloge. Tai Lustre failų sistema, kuriai naudojamas DDN S2A9900 diskų masyvas su 600TB (~350TB realiai) SATA diskų. Joje kiekvienam PST naudotojui yra sukuriamas /scratch/lustre/home/username katalogas, kur username - PST naudotojo vardas. Šios failų sistemos failai yra vienodai pasiekiami visuose skaičiavimo mazguose ir mazge cluster. Prašome šiuos katalogus naudoti tik pagal paskirtį ir atlikus skaičiavimus - išsivalyti. VU MIF PST eilės (partition)
Nenaudojami skaičiavimo mazgai yra išjungiami, tai užduočių startavimas gali užtrūkti ~5-10min. Skaičiavimo mazgai yra įjungiami po vieną per minutę. Jeigu naudojate >1 skaičiavimo mazgą ir jums reikia, kad visi jie būtų įjungti, tai užduoties pradžioje įvykdykite srun true. Paketinis užduočių vykdymas (SLURM)Norint pasinaudoti PST skaičiavimo resursais, reikia formuoti užduočių scenarijus (sh arba csh). Pavyzdys (failas mpi-test-job): #!/bin/sh #SBATCH -p short #SBATCH -n4 #SBATCH -C beta mpicc -o mpi-test mpi-test.c mpirun mpi-testJame kaip specialūs komentarai yra nurodymai užduočių vykdytojui. -p short - į koią eilę siųsti (short, long, verylong). -n4 - kiek procesorių rezervuoti. -C beta - kokias ypatybes turinčius mazgus parinkti (jei nenurodyta - parinks iš visų, kurie gali tenkinti kitas sąlygas). Užduoties pradinis einamasis katalogas yra dabartinis katalogas (pwd) prisijungimo mazge iš kur paleidžiama užduotis, nebent parametru -D pakeistas į kitą. Pradiniam einamajam katalogui naudokite PST bendros failų sistemos katalogus /scratch/lustre, nes jis turi egzistuoti skaičiavimo mazge ir ten yra kuriamas užduoties išvesties failas slurm-JOBID.out, nebent nukreiptas kitur parametrais -o arba -i (jiems irgi patariama naudoti bendrą failų sistemą). Suformuotą scenarijų siunčiame su komanda sbatch $ sbatch mpi-test-jobkuri gražina pateiktos užduoties numerį JOBID. Laukiančios arba vykdomos užduoties būseną galima sužinoti su komanda squeue $ squeue -j JOBID Su komanda scancel galima nutraukti užduoties vykdymą arba išimti ją iš eilės $ scancel JOBIDJeigu neatsimenate savo užduočių JOBID, tai galite pasižiūrėti su komanda squeue $ squeueUžbaigtų užduočių squeue jau neberodo. Jeigu nurodytas procesorių kiekis nėra pasiekiamas, tai jūsų užduotis yra įterpiama į eilę. Joje ji bus kol atsilaisvins pakankamas kiekis procesorių arba kol jūs ją pašalinsite su scancel. Vykdomos užduoties išvestis (output) yra įrašoma į failą slurm-JOBID.out. Jei nenurodyta kitaip, tai ir klaidų (error) išvestis yra įrašoma į tą patį failą. Failų vardus galima pakeisti su komandos sbatch parametrais -o (nurodyti išvesties failą) ir -e (nurodyti klaidų failą). Daugiau apie SLURM galimybes galite paskaityti Quick Start User Guide. Interaktyvios užduotys (SLURM)Interaktyvias užduotis galima pradėti vykdyti su komanda srun: $ srun --pty $SHELL Įvykdę aukščiau pateiktą komandą prisijungsite prie SLURM paskirtos skaičiavimo mazgo aplinkos ir galėsite tiesiogiai vykdyti ir derinti programas jame. Įvykdę komandas atsijunkite nuo skaičiavimo mazgo su komanda $ exit Jeigu norima vykdyti grafines programas, tai reikia jungtis su ssh -X į uosis.mif.vu.lt ir cluster: $ ssh -X uosis.mif.vu.lt $ ssh -X cluster $ srun --pty $SHELL Įvadas į OpenMPIMPI programų kompiliavimasPaprastos MPI programos pavyzdys yra kataloge /scratch/lustre/test/openmpi. mpicc (mpiCC, mpif77, mpif90) yra apvalkalai C (C++, F77, F90) kompiliatoriams, kurie automatiškai įtraukia į komandų eilutę reikiamus MPI intarpų (include) ir bibliotekų failus. $ mpicc -o foo foo.c $ mpif77 -o foo foo.f $ mpif90 -o foo foo.f MPI programų vykdymasMPI programos startuojamos su mpirun arba mpiexec programa. Daugiau apie jas galima sužinoti su komanda man mpirun arba man mpiexec. Paprasta (SPMD) programa gali būti startuojama su tokia mpirun komandų eilute. $ mpirun foo Tai naudos visus paskirtus procesorius, pagal tai, kiek jų buvo užsakyta. Jeigu norima pasinaudoti mažiau, tai mpirun galima nurodyti parametrą -np kiekis. Nepageidaujama ilgesniam laikui naudoti mažiau, nei rezervuota, nes neišnaudoti CPU lieka laisvi. Didesnį kiekį, nei rezervuotą, yra griežtai draudžiama naudoti, nes tai gali turėti įtakos kitų užduočių vykdymui. Daugiau apie instaliuotą OpenMPI yra OpenMPI puslapyje. Užduočių efektyvumas
Nuorodos
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pastaba. Dalis informacijos šiuose puslapiuose prieinama tik VU MIF kompiuterių tinklo naudotojams, pateikusiems savo VU MIF naudotojo vardą ir slaptažodį.
© 1999 - 2025 VU MIF Skaitmeninių tyrimų ir skaičiavimo centras
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||