Supercomputador PROTEUS
El supercomputador PROTEUS es el principal servicio que el Instituto Interuniversitario Andaluz Carlos I de Física Teórica y Computacional (iC1) ofrece a sus miembros y colaboradores. Proporciona un entorno HPC (High Performance Computing) que incorpora las últimas tendencias en computación y está optimizado para cálculos y simulaciones científicos. Está formado por un clúster de nodos de alto rendimiento con capacidades de cloud computing y cloud storage.
PROTEUS, desde su nacimiento, ha tenido una gran acogida y demanda, por lo que ha sido necesaria una constante serie de mejoras y ampliaciones.
UN POCO DE HISTORIA
Se inaugura el servicio de supercomputación en el iC1. En aquel entonces, se contaba con 24 procesadores y una potencia de 200 GFLOPs. El entorno de ejecución se basaba en MOSIX y las cuentas de los usuarios estaban compartidas por NFS.
Se amplió a 48 procesadores, con una potencia de unos 500 GFLOPs.
Primera gran actualización. Considerable aumento de la potencia (160 procesadores y 1500 GFLOPs). Incorporación de personal técnico con dedicación completa que introduce el gestor de colas Condor y el sistema de archivos distribuido GlusterFS.
Nueva ampliación. Pasamos a tener 600 procesadores y 5500 GFLOPs. Como mejoras en el entorno, se cuentan con puntos de restauración de los programas, redundancia de datos y almacenamiento secundario para copias de seguridad.
Se amplia la potencia hasta 1100 procesadores y 13000 GFLOPs. Las novedades en el sistema son un mejor control sobre programas paralelos y con grandes necesidades de memoria, almacenamiento en la nube y la incorporación de tarjetas gráficas programables. El sistema de archivos pasa a estar basado en CephFS.
Nuevamente, se amplia el número de procesadores y memoria (1300 procesadores y 27000 GFLOPs). Se crea una red de baja latencia, Infiniband FDR, que conecta los últimos nodos para la ejecución de trabajos distribuidos mediante MPI.
Se refuerzan los servidores de gestión para que el cluster sea más robusto frente a fallos hardware, pudiendo seguir funcionando a pesar de que estos provoquen la caída de algunos nodos, obtenido mediante la virtualización de los nodos de gestión. Se mejora la red troncal de E/S con conexiones de 10G. Los backups se hacen sobre cintas. Se crea el sistema de archivos LUSTRE para alto ratio de E/S y escrituras paralelas.
Nueva gran actualización. 1100 nuevos procesadores (2300 en total y 90000GFLOPs). Aumento y mejora de la capacidad del sistema de archivos. Nodos de ejecución diskless. Licencias Mathematica. Gestor de colas SLURM. Entorno de módulos Lmod.
Aplicaciones y Recursos
PROTEUS está gestionado por software libre GNU/Linux. Su arquitectura es de tipo Beowulf, (implantado por primera vez por la NASA y ampliamente utilizado, entre otras, el propio Google), cuya mayor ventaja es que con un presupuesto muy ajustado se puede obtener una gran potencia de cálculo mientras que su mantenimiento es poco costoso.
La anterior versión de PROTEUS llegó incluso a desbordarse por el uso intensivo del mismo, pues los científicos han estado utilizando sus recursos al cien por cien desde que se inauguró en 2008. Desde entonces se encuentra en constante ampliación y mejora.
Este éxito de uso es atribuible a la política de gestión de PROTEUS, que no establece límite temporal en la ejecución de los procesos (algunos llegan a estar en ejecución durante seis meses), ni se asignan cuotas de memoria ni de uso del disco duro, sino que hay un gestor automatizado (Slurm) que, en caso de saturación, prioriza al usuario que menos tiempo de cálculo ha utilizado hasta ese momento.
Supercomputación y Ciencia
El acceso a herramientas de computación es vital para el desarrollo adecuado de la actividad investigadora en numerosos campos de estudio. La supercomputación nos permite realizar simulaciones con un gran número de cuerpos e interacciones, obtener estadísticas sobre estas de forma masiva, o poner a prueba y refinar distintos modelos teóricos.
Estas simulaciones frecuentemente superan las capacidades de una computadora común, y en estos casos es necesario usar un sistema mucho más potente que sea capaz de satisfacer los requerimientos de estas actividades científicas.
Por ejemplo, dentro de la física, la realización de simulaciones es un pilar de campos como la física de la atmósfera, la dinámica de fluidos, o la astrofísica, en las que es muy difícil trabajar en la escala y número de partículas correspondientes, o la física cuántica, en la que la mayoría de sistemas cuánticos no permiten una solución analítica.
A pesar de esto, la importancia de este tipo de metodología no se reduce al campo de la física, pues es de tremenda importancia en otros campos de la ciencia en los que el proceso de simulación es vital, como por ejemplo a la hora de estudiar sistemas biológicos.
PROTEUS da acceso a esta serie de herramientas fundamentales para la
labor de investigación a un gran número de científicos del Instituto
Carlos I, lo que facilita el progreso de su actividad científica.
- AstrofísicaEstudio de galaxias y cosmología
- Bioinformática y biofísicaADN, dinámica de procesos celulares
- NeurocienciaEstudio del cerebro y medios neuronales
- Física estadísticaSistemas fuera del equilibrio
- SociofísicaDinámica de poblaciones
- Física cuánticaTeoría de la información, computación cuántica