Los comandos seff y sacct devuelven información sobre los recursos reales que han utilizado los trabajos.
- seff muestra información detallada de los recursos usados en un formato fácil de leer, aunque solo muestra un trabajo a la vez
- sacct es útil cuando se requiere info de un listado de trabajos, aunque por defecto solo muestra información mínima
sacct
Comando | Función |
---|---|
sacct |
Por defecto, muestra los trabajos que has ejecutado en la jornada actual (desde la pasada medianoche) |
sacct -S YYYY-MM-DD |
Listar los trabajos desde una fecha dada |
sacct -j <jobid> |
Listar un trabajo especifico mediante el ID de Slurm |
sacct -l -j <jobid> |
Mostrar toda la info disponible de un trabajo |
sacct -o jobname,jobid,maxrss,state,elapsed -j <slurmjobid> |
Selecciona los campos a mostrar |
sacct -e |
Muestra los campos de datos disponibles |
Nota: la ejecución de sacct supone mucha carga al sistema de colas, no se debería usar de forma continuada, como por ejemplo, en un script.
seff
seff es un script que consulta la base de datos de Slurm para mostrar de manera clara el uso de los recursos de CPU y memoria que ha hecho un trabajo.
Uso: seff <jobid>
> seff 1704594
Job ID: 1704594
Cluster: proteus
User/Group: user/users
State: COMPLETED (exit code 0)
Cores: 1
CPU Utilized: 00:59:31
CPU Efficiency: 99.94% of 00:59:33 core-walltime
Job Wall-clock time: 00:59:33
Memory Utilized: 7.55 MB
Memory Efficiency: 1.08% of 700.00 MB
seff devuelve el estado de finalización del trabajo, el número de CPUs usadas, el tiempo total y tiempo de CPU, memoria solicitada y memoria usada. En rojo se ha marcado la proporción de uso de estos recursos. En el ejemplo, la CPU se ha aprovechado, no así la memoria.
Uso responsable de los recursos
PROTEUS es una infraestructura de uso compartido. Aunque el sistema intenta que a la larga, todos los usuarios tengan la misma oportunidad de usarlo, un uso racional de los requisitos que se demandan posibilitan que más trabajos se puedan ejecutar al mismo tiempo, repercutiendo una mejor experiencia de uso para todos.
Por esta razón, se solicita y se recomienda que, una vez finalizado un programa, especialmente si se va a ejecutar más veces, se evalúe los recursos que realmente se han usado y que se ajuste la solicitud de ellos en consonancia.