 
        
    El NVIDIA DGX Spark, una máquina diseñada para prototipado rápido de inteligencia artificial local, parece no estar cumpliendo con las cifras prometidas por la compañía. Según el desarrollador John Carmack, fundador de Keen Technologies y ex CTO de Oculus VR, el rendimiento real del sistema se sitúa muy por debajo de las especificaciones oficiales, con un consumo que apenas alcanza los 100W, frente a los 240W que NVIDIA había anunciado.
Rendimiento a la mitad de lo prometido
El DGX Spark mini PC fue presentado como un equipo compacto para desarrolladores de IA, con un rendimiento estimado de 31 TFLOPS en FP32 y hasta 1.000 TOPS en precisión FP4. Sin embargo, las pruebas de Carmack muestran que el sistema apenas alcanza 480 TFLOPS en FP4 y 60 TFLOPS en BF16, quedando muy lejos de los 125 TFLOPS prometidos en ese formato.
Esta diferencia sugiere que el equipo está funcionando con una potencia recortada o que el firmware actual no está optimizando correctamente el rendimiento de la GPU integrada. La reducción del consumo también podría estar vinculada a limitaciones térmicas que obligan al sistema a bajar frecuencias y voltajes para evitar sobrecalentamiento.
Posibles problemas de refrigeración y firmware
El SoC GB10, núcleo del DGX Spark, está diseñado con un TDP de 140W, al que se suman varios decenas de vatios del sistema de memoria LPDDR5X de 128 GB. En teoría, el conjunto debería acercarse a los 200W de carga real, por lo que los 100W medidos indican un posible problema de throttling térmico o de gestión de energía.
Algunos desarrolladores también han reportado reinicios espontáneos y bloqueos del sistema bajo cargas intensivas, síntomas que apuntan a errores de firmware o refrigeración insuficiente. NVIDIA podría intentar mitigar estos fallos mediante actualizaciones de software o incluso un sistema de refrigeración adicional para los primeros lotes, vendidos a 3.999 dólares (≈ 3.430€).
Detalles técnicos del DGX Spark
El DGX Spark combina un SoC híbrido formado por un chip CPU Arm v9.2 de 20 núcleos suministrado por MediaTek, junto a una GPU NVIDIA Blackwell en un encapsulado 2.5D fabricado por TSMC en 3 nm. Cada clúster de diez núcleos cuenta con 16 MB de caché L3, mientras que el conjunto utiliza memoria LPDDR5X-9400 de 128 GB sobre un bus de 256 bits, con un ancho de banda teórico de 301 GB/s.
En conectividad, el sistema incluye un NIC ConnectX-7 enlazado mediante PCIe Gen 5 x8 para redes de baja latencia y soporte NVMe directo desde el die del CPU.
NVIDIA asegura que el DGX Spark puede alcanzar 1 PetaFLOP en FP4 con sparsity estructurada, aunque esta técnica —que ignora ceros en redes neuronales— solo se aplica en modelos específicos. Desactivarla reduce el rendimiento a aproximadamente la mitad, coincidiendo con los resultados que están observando los primeros usuarios.
A falta de una revisión de firmware estable, el DGX Spark sigue siendo un producto prometedor, pero aún lejos de la madurez esperada para una herramienta de desarrollo de IA profesional.
Vía: TechPowerUp





















