NVIDIA pulveriza los benchmarks de MLPerf Training v5.1 con Blackwell Ultra y NVFP4

NVIDIA pulveriza los benchmarks de MLPerf Training v5.1 con Blackwell Ultra y NVFP4

La nueva generación de GPU NVIDIA Blackwell Ultra ha vuelto a dejar huella en el sector del cómputo acelerado. En la última ronda de pruebas MLPerf Training v5.1, el fabricante ha conseguido el mejor tiempo de entrenamiento en los siete benchmarks oficiales, abarcando desde modelos de lenguaje hasta generación de imágenes, sistemas de recomendación y visión artificial.

NVIDIA fue además la única compañía en presentar resultados en todas las categorías, un reflejo de la madurez de su ecosistema CUDA y de la versatilidad que ofrece su plataforma tanto en hardware como en software.

Blackwell Ultra marca un nuevo nivel de rendimiento

El sistema GB300 NVL72, impulsado por la arquitectura Blackwell Ultra, debutó en esta edición con mejoras notables respecto a la generación Hopper. En comparación directa, el nuevo hardware logró más de 4× de rendimiento en el entrenamiento de Llama 3.1 405B y cerca de 5× en el ajuste fino de Llama 2 70B utilizando la misma cantidad de GPU.

NVIDIA pulveriza los benchmarks de MLPerf Training v5.1 con Blackwell Ultra y NVFP4

Entre los avances más destacados se incluyen 15 petaflops de potencia en NVFP4, el doble de capacidad en las capas de atención y 279 GB de memoria HBM3e por GPU. Además, el sistema de interconexión Quantum-X800 InfiniBand —con 800 Gb/s de ancho de banda— duplicó la capacidad de comunicación entre racks respecto a la generación anterior, optimizando la escalabilidad para cargas masivas de IA.

NVFP4: precisión extrema para el entrenamiento IA

Una de las claves de estos resultados ha sido la adopción del nuevo formato de precisión NVFP4, una evolución que permite realizar cálculos con menos bits sin sacrificar exactitud. Esta representación numérica ofrece hasta el triple de rendimiento frente a FP8 en Blackwell Ultra, algo inédito hasta la fecha en MLPerf Training.

NVIDIA pulveriza los benchmarks de MLPerf Training v5.1 con Blackwell Ultra y NVFP4

Gracias a esta tecnología, NVIDIA se convierte en la primera plataforma en cumplir los exigentes estándares de precisión del benchmark utilizando FP4 en procesos de entrenamiento de modelos de gran escala.

Récords en Llama 3.1 y FLUX.1

El entrenamiento del modelo Llama 3.1 405B se completó en tan solo 10 minutos con más de 5.000 GPU Blackwell, un registro que mejora en 2,7 veces el resultado anterior. Incluso con la mitad de recursos —2.560 GPU—, el sistema alcanzó un tiempo de 18,79 minutos, un 45 % más rápido que la marca previa.

También se establecieron nuevos récords en los benchmarks Llama 3.1 8B, con 5,2 minutos de entrenamiento, y FLUX.1, un modelo de generación de imágenes entrenado en 12,5 minutos.

NVIDIA pulveriza los benchmarks de MLPerf Training v5.1 con Blackwell Ultra y NVFP4

Una comunidad que impulsa el rendimiento

La ronda de MLPerf v5.1 contó con la colaboración de más de quince organizaciones tecnológicas que trabajan junto a NVIDIA, entre ellas ASUS, Dell, Lenovo, Supermicro, HPE y la Universidad de Florida. Este ecosistema de socios refuerza el liderazgo de la compañía en entornos de entrenamiento masivo y computación distribuida.

Con una cadencia de innovación anual, NVIDIA continúa impulsando la evolución del entrenamiento y la inferencia de modelos de IA a gran escala, consolidando su posición como el referente absoluto en aceleración computacional.

Vía: TechPowerUp

Sobre el autor