Lenovo ha anunciado su acuerdo con la Universidad Tecnológica Chalmers para usar una infraestructura tecnológica de Lenovo y NVIDIA en su recurso computacional a gran escala Alvis. El proyecto ha visto la entrega e implementación de un sistema de computación en clúster para la investigación mediante la inteligencia artificial y el aprendizaje automático en lo que es el mayor clúster de HPC para IA y ML en la región de Europa, Oriente Medio y África.
Alvis (que en escandinavo antiguo significa «omnisciente») es un recurso de supercomputación nacional perteneciente a SNIC (la infraestructura nacional sueca para la computación). Se inició a principios de 2020 y desde entonces se ha desarrollado para sostener una capacidad que resuelva las extensas tareas de investigación a la mayor escala. El sistema computacional, financiado por la Fundación Knut y Alice Wallenberg y suministrado por Lenovo, se encuentra ubicado en la Universidad Tecnológica Chalmers, en Gotemburgo, sede de la mayor iniciativa de investigación de la Unión Europea: Graphene Flagship.
Este proyecto colaborativo permite a los investigadores suecos que necesiten mejorar sus cálculos y modelos matemáticos aprovechar los servicios de Alvis a través del sistema de aplicaciones de SNIC, con independencia del campo de investigación en el que trabajen. Con ello se ayuda a los investigadores que ya están utilizando el aprendizaje automático para analizar problemas complejos, y a aquellos que están investigando el uso del aprendizaje automático para resolver problemas en sus respectivos campos, con el potencial de dirigir innovadoras investigaciones académicas en campos como la computación cuántica y la investigación impulsada por datos para la sanidad y la ciencia.
«El proyecto Alvis es un ejemplo excelente del papel que juega la supercomputación a la hora de ayudar a resolver los grandes retos de la humanidad, y Lenovo se siente orgulloso y emocionado de formar parte de ello», declaró Noam Rosen, director para EMEA de HPC e IA en Lenovo Infrastructure Solutions Group. «Con la tecnología líder en rendimiento de Lenovo, Alvis potenciará la investigación y el uso del aprendizaje automático en diversas áreas con un importante impacto en el desarrollo social, como la investigación medioambiental y el desarrollo farmacéutico. Este recurso de computación es realmente único, construido bajo la premisa de arquitecturas para distintas cargas de trabajo de IA y aprendizaje automático, y teniendo presente la sostenibilidad, ayudando a ahorrar energía y reducir las emisiones de carbono mediante el uso pionero de tecnologías de refrigeración con agua caliente».
«El primer recurso piloto para Alvis ya ha sido utilizado en más de 150 proyectos de investigación en las principales universidades de Suecia. Con esta gran ampliación y al poner los sistemas Alvis a disposición de todos los investigadores suecos, Chalmers y Lenovo desempeñan un papel crucial a la hora de ofrecer un ecosistema de HPC nacional para la investigación del futuro», expuso Sverker Holmgren, director de Chalmers e-Infrastructure Commons, donde se alberga el sistema Alvis.
Chalmers ha decidido implementar un clúster escalable con varios servidores Lenovo ThinkSystem para proporcionar la combinación perfecta de GPU NVIDIA a sus usuarios, de modo que sé de prioridad al ahorro de energía y el equilibrio de las cargas de trabajo. Esto incluye el sistema Lenovo ThinkSystem SD650-N V2 para proporcionar la potencia de las GPU NVIDIA A100 Tensor Core, y el ThinkSystem SR670 V2, certificado por NVIDIA, para las GPU NVIDIA A40 y T4.
«El trabajo que realizamos en la Universidad Chalmers con el superordenador nacional Alvis ofrecerá a los investigadores la potencia que requieren para simular y predecir nuestro mundo», explicó Rod Evans, director para EMEA de computación de alto rendimiento en NVIDIA. «Juntos, proporcionamos a la comunidad científica las herramientas para solucionar los mayores retos de supercomputación del mundo, desde la previsión del tiempo al descubrimiento de fármacos».
La arquitectura de almacenamiento proporciona una nueva solución Ceph de 7.8 petabytes que se integrará en el entorno de almacenamiento actual en Chalmers. NVIDIA Quantum 200 Gb/s InfiniBand propriociona el sistema con baja latencia, alto rendimiento de los datos en red y motores inteligentes de aceleración de la computación. Con estas funcionalidades de infraestructura de alta velocidad, los usuarios cuentan con casi 1.000 GPU, sobre todo NVIDIA A100 Tensor Core, que incluyen más de 260.000 núcleos de procesamiento y más de 800 TFLOPS de potencia computacional para lograr unos tiempos de respuesta mucho más rápidos en sus investigaciones.
Además, Alvis utiliza las tecnologías de refrigeración líquida Neptune de Lenovo para lograr una eficiencia informática incomparable. En un principio, se propuso un sistema de enfriamiento solo por aire para el proyecto, pero Chalmers decidió en su lugar poner en marcha las funcionalidades de refrigeración mediante agua caliente de Lenovo Neptune para reducir los costes operativos a largo plazo y lograr un sistema de infraestructura de IA más ecológico. Como resultado, la universidad espera importantes ahorros energéticos gracias a las eficiencias de refrigeración por agua.
La solución HPC está en producción desde febrero de 2022 y estará totalmente operativa en el verano de 2022.