Manual de uso

⌘K
  1. Inicio
  2. Documentos
  3. Manual de uso
  4. 3. Envío de trabajos
  5. Funcionamiento de Slurm

Funcionamiento de Slurm

Ciclo de vida de un trabajo Slurm

Los trabajos de Slurm pasan por las siguientes etapas:

  • el usuario hace una descripción del trabajo y lo envía a Slurm (sbatch/srun)
  • el trabajo pasa a la cola de trabajos y se le asigna un identificativo (ID)
  • cuando hay suficientes recursos disponibles, Slurm pone el trabajo en ejecución hasta su finalización
  • si se produce algún error, Slurm detiene el trabajo
  • mientras está en espera o en ejecución, el usuario puede consultar su estado o cancelarlo
  • se redirige la salida estándar y de errores a fichero

Estados de los trabajos

Los estados por los que pasa un trabajo durante su ciclo de vida son:

  1. Pending (PD): Trabajo en cola.
  2. Running (R): Recursos asignados y trabajo en ejecución.
  3. Suspended (S): Recursos asignados y trabajo suspendido.
  4. Completing (CG): Trabajo completado y retirado de la cola.
    1. Cancelled (CA): Trabajo cancelado por el usuario.
    2. Completed (CD): Trabajo finalizado correctamente.
    3. Failed (F): Ejecución finalizada incorrectamente.
    4. NodeFail (NF): Terminado por fallo en el nodo.
    5. TimeOut (TO): Terminado por alcanzar el TimeOut.

¿Cómo podemos ayudarte?