NVIDIA muestra su nueva Vera Rubin Superchip con CPU de 88 núcleos y doble GPU Rubin de 100 PetaFLOPS FP4

NVIDIA muestra su nueva Vera Rubin Superchip con CPU de 88 núcleos y doble GPU Rubin de 100 PetaFLOPS FP4

NVIDIA ha presentado en su conferencia GTC de Washington D.C. su nuevo sistema “Vera Rubin” Superchip, una plataforma diseñada para el futuro de la IA a gran escala y la computación exaescala. Este nuevo diseño combina una CPU Vera de 88 núcleos y 176 hilos con dos GPUs Rubin, integradas en un mismo encapsulado de arquitectura simbiote.

100 PetaFLOPS FP4 en un único paquete

Cada GPU Rubin alcanza 50 PetaFLOPS de cálculo FP4, lo que permite a la Superchip alcanzar un total de 100 PetaFLOPS FP4. NVIDIA confirmó que los prototipos de ingeniería ya se están validando en laboratorios, con producción en masa prevista para 2026 y despliegues globales durante 2027.

Las GPUs Rubin integran dos chiplets de cómputo de tamaño reticular completo (aproximadamente 830 mm² cada uno) y están acompañadas por ocho pilas HBM4, alcanzando 288 GB de memoria HBM4 por GPU y 576 GB en total para la Superchip. Además, el sistema incluye módulos SOCAMM2 LPDDR5X de baja latencia, con configuraciones típicas de hasta 1,5 TB por CPU Vera, según documentos previos de NVIDIA.

NVIDIA muestra su nueva Vera Rubin Superchip con CPU de 88 núcleos y doble GPU Rubin de 100 PetaFLOPS FP4

CPU Vera: diseño ARM personalizado de 88 núcleos

La CPU Vera utiliza un diseño ARM totalmente personalizado con 88 núcleos y 176 hilos, abandonando la arquitectura Neoverse empleada en la generación Grace. Esta nueva CPU adopta una estructura multinúcleo basada en chiplets, con un chiplet I/O dedicado, optimizado para reducir la latencia en flujos intensivos de IA.

El enlace NVLink alcanza ahora 1,8 TB/s de ancho de banda, asegurando una comunicación fluida entre CPU y GPU para tareas de entrenamiento e inferencia de IA de última generación.

NVIDIA muestra su nueva Vera Rubin Superchip con CPU de 88 núcleos y doble GPU Rubin de 100 PetaFLOPS FP4

Arquitectura NVL y escalado exaescala

La Vera Rubin Superchip servirá como bloque base para sistemas NVL de próxima generación. NVIDIA detalló configuraciones como la NVL144, capaz de entregar 3,6 ExaFLOPS FP4 en inferencia y 1,2 ExaFLOPS FP8 en entrenamiento, con 13 TB/s de ancho de banda HBM4 agregado y hasta 75 TB de memoria rápida por rack.

En el siguiente nivel, la Rubin Ultra NVL576 escalará hasta 15 ExaFLOPS FP4, con cientos de terabytes de memoria total destinada a hiperescaladores y centros de investigación avanzada.

Un ecosistema para la próxima era de la IA

La compañía también presentó configuraciones CPX y variantes de bandejas de cómputo ajustadas para modelos de gran contexto y tareas de IA generativa de alta densidad, integradas en su ecosistema NVL. Con este diseño, NVIDIA busca consolidar su liderazgo en IA, HPC y supercomputación, ofreciendo una plataforma unificada de CPU, GPU y memoria de alto ancho de banda capaz de escalar hasta la exaescala.

Vía: TechPowerUp

Sobre el autor