Hace poco tuve la suerte de visitar el hogar del Superordenador Picasso, el Centro de Supercomputación y Bioinnovación (SCBI) de la Universidad de Málaga (UMA). Este centro se encarga de proporcionar soporte y recursos científicos Al personal de investigación de la universidad, la Plataforma Andaluza de Bioinformática PAB y Red Española de Supercomputación (RES).
Esta es una visita que debería haber hecho hace años, pero la verdad es que este supercomputador es un gran desconocido hasta para los habitantes de Málaga. Sinceramente, pienso que debería darse a conocer más esta instalación, ya que puede ofrecer una vista más amplia de cara a un futuro profesional, además de profundizar y conocer más acerca de la supercomputación y la bioinformática. Especialmente si tenemos en cuenta la tendencia que hay de cara al futuro en estas áreas.
Durante la visita, nos recibió Rocío Bautista, Doctora en Biología y responsable de la Unidad de Bioinformática del SCBI en la UMA. Rocío, además de ser una de las principales artífices de esta visita, es una amante de la divulgación. Buena muestra de ello es que no tuvo reparos en que me colase en la visita para preguntarle a ella y al equipo de ingenieros responsables de mantener el superordenador acerca de su trabajo.
Una vez en la sala del Picasso, nos acompañaron Rafael Larrosa Jiménez y Fernando Moreno Jabato, dos de los administradores de sistemas de las instalaciones que se prestaron a responder todas mis inquietudes.
¿Cómo se puede obtener acceso al Superordenador Picasso?
Mi primera duda la tenía muy clara, quería saber quién y cómo puede hacer uso de las instalaciones. El uso está limitado a los investigadores y las investigadoras de la universidad de Málaga quienes, en muchos casos, tienen que ser asesorados sobre el uso del sistema de colas y herramientas que pueden utilizar. Aunque esto también puede ocurrir con proyectos de investigación con los que suelen colaborar.
En líneas generales, las personas se acostumbran rápido y fácil al sistema de colas que utilizan. Por resumirlo mucho, los miembros del equipo tienen que analizar las necesidades de cálculo del proyecto, dividir esa información en paquetes de la mejor manera posible y con esta información, decidir a qué tipo de ordenador enviarla y cuánto tiempo. Por norma general no más de 7 días. Así dicho parece muy sencillo la verdad, aunque imagino que para ellos será poco más que el día a día.
Como ya he dejado caer, en estas instalaciones hay varias configuraciones de nodos disponibles, con distintas especificaciones de hardware y software según las necesidades. De hecho, si entráis en su página, podéis ver todas las especificaciones de hardware de las que disponen. Aunque a mí se me fuesen los ojos en dirección a las maquinas con 32 NVIDIA DGX A100 por culpa del logo de la compañía que podéis ver en la siguiente foto.
Tradición en Supercomputación
Desde los 90, en la UMA hay una fuerte tradición de Supercomputación, cuando se comenzaron a utilizar ordenadores en paralelo para la investigación y aplicaciones de cálculo intensivo. No fue hasta el 97 cuando se instaló el primer Picasso, un Origin 2000 de SGI, que ha ido actualizándose con el tiempo hasta llegar al día de hoy.
En 2021 se modificó la estructura del Picasso, añadiendo más espacio para racks, mejorando el sistema de ventilación y actualizar casi todos los nodos, lo que transformó a este superordenador en el segundo más potente de España. Ahora cuenta con unos 30.000 cores, 170TB de RAM y 7 Petabytes de almacenamiento. Todo ello conectado con Infinity Band, que alcanza velocidades de transferencia de hasta 200 gbit/s.
Equipos principales:
- 126 nodos SD530, 2 procesadores Intel Xeon Gold 6230R, 192GB de RAM
- 156 nodos Lenovo sr645, 2 procesadores AMD EPYC 7H12, 512 de RAM
- 24 nodos Bull R282-Z90, 2 procesadores AMD EPYC 7H12, 2TB de RAM
- 4 nodos DGX-A100, 8 GPUs (Nvidia A100), 1 TB de RAM
Yo soy de la mentalidad de que si algo funciona no lo toques, pero a estos niveles no me quiero ni imaginar lo que supone. Rafael me comentó que algo muy común es que, en los proyectos de investigación, utilizasen un software muy específico con una versión en cuestión. Esto puede no parecer gran cosa, pero estas máquinas tienen un Sistema Operativo Linux, lo que para ciertos usos y configuraciones puede resultar complejo. Al fin y al cabo, sobre ellos recae saber no solo que software es el más indicado para hacer el cálculo, sino que también hacer algún ajuste si es necesario. En algunos casos también pueden llegar a recomendar la adquisición de programas específicos.
Más allá del Hardware del Superordenador Picasso
En la visita, también tuve la escandalosa suerte de entrar en la sala de servidores donde, bajo el ruido de más de 4 PFlops, pregunté acerca del mantenimiento y abastecimiento del monstruo.
Tal y como se ve en la imagen, las instalaciones usan un sistema optimizado de refrigeración de los llamados pasillos de frio y calor, canalizando el aire frío de la ventilación con unas estructuras colocadas sobre las rejillas para focalizarlo al central de los racks.
Como es lógico, estas instalaciones tienen que estar protegidas ante posibles peligros, uno de ellos los incendios. Por eso, la habitación del Picasso es estanca y en caso de incendio se cierra herméticamente para que los sistemas de extinción actúen sin dañar el equipamiento. Obviamente, todo está monitorizado las 24 horas al día. Hasta los cables de alimentación son específicos para que puedan transmitir información que monitorizan en tiempo real. Esto me llevó obviamente a preguntar acerca del coste y suministro.
Para nosotros, horrorizados con el precio de una tarjeta gráfica a día de hoy, esto sigue asustando. Solo este tipo de cable rondaba los 1.500€ y a esto hay que sumarle la disponibilidad, que no siempre la hay. Y aunque tengan cierta prioridad, puede demorarse meses en recibirlo. <<El precio de una NVIDIA GGX A100 os dejo que lo investiguéis vosotros…>>.
En cuanto al suministro energético, no me sorprendió especialmente. En caso de corte, las instalaciones disponen de unas baterías capaces de proporcionar una autonomía de 10 a 15 minutos y también de varios generadores diferentes. De esta forma, si hay un corte prolongado, pueden seguir dando el servicio, al menos mientras haya combustible.
Tecnología e Investigación
Pero todo no es la informática, aquí también podréis ver más de cerca laboratorios avanzados de Nanotécnología que disponen de microscopios de última generación y equipos para análisis a nivel nanométrico o la unidad Omics, centrados en genotipado y análisis bioinformático.
Ya sabéis que a mí no me gusta desgranaros todo al milímetro, por ello me dejo cosas en el tintero, pero sí que os doy una recomendación. Si tenéis curiosidad por ver un supercomputador de cerca, el superordenador Picasso de Málaga es una muy buena opción y seguro que Rocío os puede dar información muy interesante acerca del centro de Supercomputación y Bioinnovación de la Universidad de Málaga y su funcionamiento.
Pero si este os pilla lejos, seguro que hay algún nodo de la RES más cercano y de los que podéis consultar más información aquí.
Desde Fanáticos del Hardware queremos agradecer a Rocío, Rafael y Fernando el habernos abierto sus puertas para conocer estas instalaciones.