Es posible recibir avisos los eventos y estados por los que pasa un programa, como por ejemplo cuándo empieza, cuándo termina, si ha fallado, etc.
Contamos con las siguientes opciones para controlar el comportamiento de las notificaciones por email:
–mail-user: dirección de correo electrónico a la que enviar
–mail-type: evento por el que enviar el email. Estos eventos pueden ser alguno de los siguientes:
- NONE
- BEGIN
- END
- FAIL
- REQUEUE
- STAGE_OUT
- ALL (= todos los anteriores)
- TIME_LIMIT_50 (cuando se alcance el 50% del tiempo máximo de ejecución del programa)
- TIME_LIMIT_80 (ídem 80%)
- TIME_LIMIT_90 (ídem 90%)
- TIME_LIMIT (ídem total)
El correo que nos responderá en nuestro caso será slurm01@onsager.ugr.es
Ejemplo de uso en un script:
#!/bin/sh
#SBATCH -N 2 #(solicita dos nodos)
#SBATCH -n 2 #(dos tareas en total)
#SBATCH -t 00:00:30 #(30 sec ejecución)
#SBATCH --mail-type=begin #Envía un correo cuando el trabajo inicia
#SBATCH --mail-type=end #Envía un correo cuando el trabajo finaliza
#SBATCH --mail-user=usuario@onsager.ugr.es #Dirección a la que se envía
srun hostname
# sbatch ./job.sh
Submitted batch job 16899
slanzarv:
slanzarv por defecto envía un mail cuando el programa ha terminado o si ha fallado. Este comportamiento se puede desactivar con el flag –no-mail
$ slanzarv --no-mail miprograma