Manual de utilização do ambiente de processamento paralelo do LAD

O presente documento tem como objetivo orientar e instruir os usuários do Laboratório de Alto Desempenho da PUCRS, do PUCRS Ideia, sobre a utilização do laboratório.
Em caso de dúvidas, pode entrar em contato via e-mail: contato.lad@pucrs.br ou suporte.lad@pucrs.br.

4.3. Comando "srun"

Este comando é usado para a execução de aplicações, alocando recursos (ou utilizando recursos já alocados). Pode ser utilizado para iniciar uma alocação com uma sessão batch interativa.

Utilização:

user@cluster:~$ srun -N <máquinas> <demais parâmetros>


Exemplo de utilização:

user@pantanal:~$ srun -N 2 -t 5 -n 2 hostname

pantanal03

pantanal02


Nesse caso foram alocadas duas máquinas (-N) pelo tempo de 5 minutos (-t), sendo executados dois processos (-n) do comando hostname. Neste tipo de alocação não é necessário acessar o host, o comando realizou a alocação e finalizou os processos de forma direta.

Exemplo de utilização no modo interativo:

Neste modo o usuário realiza a alocação e é redirecionado para uma das máquinas alocadas.

user@pantanal:~$ srun -N 2 -n 8 -t 5 --pty bash -i

user@pantanal02:~$`


Nesse caso foram alocadas duas máquinas (-N) pelo tempo de 5 minutos (-t) e 8 processos (-n). Os comandos podem ser executados de dentro do nó alocado, como no exemplo abaixo:

user@pantanal02:~$ srun -n 8 hostname

pantanal02

pantanal02

pantanal02

pantanal02

pantanal03

pantanal03

pantanal03

pantanal03


Caso o comando solicite mais processos do que foi alocado, uma mensagem de erro deve aparecer:

user@pantanal02:~$ srun -n 9 hostname

srun: error: Unable to create step for job 670: More processors requested than permitted`


Exemplos de utilização em modo exclusivo:

Também é possível realizar a alocação das máquinas em modo exclusivo, sendo alocados todos os processadores das máquinas requisitadas:

user@pantanal:~$ srun -N 2 -t 5 -n 2 --exclusive hostname

pantanal03

pantanal02


Neste caso o usuário optou por rodar apenas dois processos, mas por estar no modo exclusivo a limitação de processos se dá pela capacidade do conjunto de nós alocados. Como cada nó do cluster Pantanal possui 48 cpus (para verificar use o comando sinfo), o limite de processos nessa alocação seria 96 (2x48).

No próximo exemplo realizamos uma alocação interativa, porém nesta etapa não é necessário especificar a quantidade de processos a serem executados:

user@pantanal:~$ srun -N 2 -t 5 --exclusive --pty bash -i

user@pantanal02:~$


A quantidade de processos deve ser especificado apenas na etapa de execução dentro da máquina em que o usuário foi redirecionado, como no exemplo abaixo:

user@pantanal02:~$ srun -n 8 hostname

pantanal02

pantanal02

pantanal02

pantanal02

pantanal03

pantanal03

pantanal03

pantanal03