Cluster

De Instituto de Física - UFRGS
Revisão de 12h53min de 1 de novembro de 2016 por Samoel (discussão | contribs)
Ir para navegaçãoIr para pesquisar

Submeter jobs

Para rodar, criar um arquivo (script.sh) com o seguinte conteúdo.

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores 
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p short # Partition to submit to 
 #SBATCH --qos qos_short # QOS 
 
 ./a.out

As partições possuem um qos associado, com o mesmo nome, adicionando "qos_" a frente do nome:

partição: short -> qos: qos_short -> limite de 2 semanas

partição: long -> qos: qos_long -> limite de 3 meses


Caso deseje rodar em gpu, é necessário especificar a fila e pedir explicitamente a gereric resource gpu:

 #!/bin/bash 
 #SBATCH -n 1 # Number of cores
 #SBATCH -N 1 # Number of nodes 
 #SBATCH -t 0-00:05 # Runtime in D-HH:MM 
 #SBATCH -p gpu # Partition to submit to 
 #SBATCH --qos qos_gpu # QOS
 #SBATCH --gres=gpu:1
 
 ./a.out

Para pedir alguma gpu específica, use um constraint adicionando a linha:

 #SBATCH --constraint="gtx970"


Para submeter o job, execute o comando

 sbatch script.sh

Comandos úteis

  • Para listar os jobs:
 squeue
  • Para deletar um job:
 scancel
  • Para listar as partições disponíveis:
 sinfo
  • Para listar as gpus presentes nos nós:
 sinfo -o "%N %f"