En el Instituto Carlos I de Física Teórica y Computacional contamos con varias herramientas que ayudan a conocer el estado de PROTEUS y su carga de trabajo. Es útil conocer esta información a la hora de planificar el envío de nuevos trabajos. También nos permiten conocer datos más detallados sobre la ejecución de los programas.
Ganglia
Monitorización general
Xdmod
Estadísticas de uso PROTEUS
Monitorización específica.
También pueden obtenerse algunos datos estadísticos directamente desde Slurm. Algunos de los comandos más útiles relativos a estos datos son:
- squeue –start : Muestra la hora estimada de comienzo de los trabajos en espera.
- sqstat : Muestra información detallada de las colas y la utilización global del equipo. Para utilizarlo hay que
añadir las siguientes variables de entorno:export STUBL_HOME=/opt/cesga/sistemas/stubl-0.0.9/
export PATH=$PATH:$STUBL_HOME/bin - smap : muestra un diagrama con la distribución de los trabajos en el equipo, agrupados por rack.