Los nuevos servidores NVIDIA Blackwell Ultra representan un salto sin precedentes en potencia computacional, pero también imponen enormes exigencias térmicas. El GB300 NVL72, considerado por la firma como su configuración tope de gama, combina 72 GPUs Blackwell Ultra con procesadores Grace en un sistema refrigerado por líquido, capaz de alcanzar rendimiento exaescala en FP4 y una eficiencia energética por megavatio muy superior a las plataformas HGX previas.
Sin embargo, semejante densidad de cálculo tiene un precio: los costes de refrigeración por rack rondan los 50.000$, según un modelo de valoración elaborado por Morgan Stanley.
100 kW de calor solo en GPUs
Cada chip Blackwell Ultra cuenta con un TDP de hasta 1.400W, lo que implica que las 72 GPUs instaladas generan más de 100 kW de calor en carga máxima. Si se añaden los 32 procesadores Grace que complementan el sistema, el consumo total supera con facilidad los 100 kW térmicos, una cifra imposible de gestionar mediante refrigeración por aire tradicional.
Por ello, NVIDIA emplea un avanzado sistema de refrigeración líquida, diseñado para mantener las temperaturas estables bajo cargas sostenidas, garantizando el máximo rendimiento sin comprometer la fiabilidad.
Desglose de costes de refrigeración
Según el análisis de Morgan Stanley, cada rack Oberon NVL72 incluye 18 bandejas de cálculo, cada una con un consumo estimado de 6,6 kW y un coste de refrigeración asociado de 2.260$ por bandeja, lo que equivale a 40.680$ en total.
A esto se suman nueve bandejas de conmutación, con un coste adicional de 1.020$ por unidad, alcanzando 9.180$ más. En conjunto, el sistema de refrigeración completo asciende a unos 49.860$, destacando los cold plates de alto rendimiento como los componentes más costosos del conjunto, con precios unitarios que superan fácilmente los cientos de dólares.
Preparando el salto al sistema NVL144 “Vera Rubin”
El informe también anticipa que la futura configuración “Vera Rubin” NVL144, actualmente en desarrollo, elevará aún más los requisitos térmicos debido al aumento del consumo de GPU e interconexiones.
Morgan Stanley estima que los costes de refrigeración aumentarán un 17%, alcanzando unos 55.710$ por rack, reflejando la tendencia de la industria: a medida que la densidad computacional y el TDP aumentan, también crecen los costes y la complejidad del sistema de disipación térmica.
Con los conmutadores consumiendo más energía y las GPU requiriendo soluciones de refrigeración cada vez más sofisticadas, NVIDIA y sus socios OEM afrontan el reto de mantener la eficiencia térmica sin comprometer la escalabilidad de las infraestructuras de IA exaescala.
Vía: TechPowerUp




















