En el Instituto Carlos I de Física Teórica y Computacional contamos con varias herramientas que ayudan a conocer el estado de PROTEUS y su carga de trabajo. Es útil conocer esta información a la hora de planificar el envío de nuevos trabajos. También nos permiten conocer datos más detallados sobre la ejecución de los programas.
Ganglia #
Monitorización general
Xdmod #
Estadísticas de uso PROTEUS
Monitorización específica. #
También pueden obtenerse algunos datos estadísticos directamente desde Slurm. Algunos de los comandos más útiles relativos a estos datos son:
- squeue –start : Muestra la hora estimada de comienzo de los trabajos en espera.
- sqstat : Muestra información detallada de las colas y la utilización global del equipo. Para utilizarlo hay que
añadir las siguientes variables de entorno:export STUBL_HOME=/opt/cesga/sistemas/stubl-0.0.9/
export PATH=$PATH:$STUBL_HOME/bin - smap : muestra un diagrama con la distribución de los trabajos en el equipo, agrupados por rack.