NVIDIA vuelve al centro del debate sobre el coste real de la infraestructura de IA a gran escala. Según Morgan Stanley, construir un centro de datos de 1 gigavatio con GPU Blackwell puede costar el doble que hacerlo con ASIC de IA personalizados de Google o Amazon, aunque la diferencia estaría en la eficiencia de cómputo por vatio.
La lectura resulta importante porque el precio de las GPU de NVIDIA sigue siendo uno de los grandes puntos de fricción para hiperescaladores y proveedores de IA. Jensen Huang ha defendido varias veces que sus chips son caros, pero ofrecen mayor retorno a largo plazo, especialmente al medir rendimiento total, eficiencia energética y madurez del ecosistema CUDA.
Blackwell costaría más, pero ofrecería más rendimiento por vatio
Morgan Stanley compara el rendimiento en TFLOPS por vatio de varias GPU de NVIDIA frente a ASIC personalizados como Google TPUv7 y Amazon Trainium. La conclusión es clara: aunque el desembolso inicial sea mayor, las GPU de NVIDIA ofrecerían entre 2 y 8 veces más eficiencia de cómputo que los chips a medida.
Este punto matiza mucho el debate sobre precios. Un centro de datos basado en Blackwell puede exigir más CapEx inicial, pero si ofrece más cálculo por vatio, puede compensar en cargas intensivas de entrenamiento e inferencia. En IA a gran escala, el coste no se mide solo por chip, sino por rendimiento útil, consumo, ocupación y amortización del clúster.
La ventaja de NVIDIA también está en el ecosistema. CUDA, bibliotecas, herramientas de despliegue y soporte de software hacen que sus GPU sean más fáciles de integrar en muchos flujos de trabajo. Los ASIC pueden ser muy eficientes en tareas concretas, pero suelen depender más de cargas optimizadas, software propio y despliegues cerrados.

La diapositiva muestra la hoja de ruta de NVIDIA para sus plataformas de IA, con Blackwell en 2024, Rubin en 2026 y Feynman en 2028, junto a sus respectivas evoluciones de NVLink y CPU asociadas.
Vera Rubin FP4 lideraría la comparativa de eficiencia
La diapositiva de Morgan Stanley sitúa a Vera Rubin en FP4 como la opción más eficiente de la comparativa, con una puntuación de 19,5 TFLOPS por vatio. Por debajo quedarían Vera Rubin en FP8 con 6,8, GB300 en FP8 con 6,0 y H100 en FP8 con 3,1.
En el lado de los ASIC personalizados, Google TPUv7 en FP8 aparecería con 4,3 TFLOPS por vatio, mientras que Amazon Trainium 3 en FP8 se situaría en 2,5 TFLOPS por vatio. Eso colocaría a Google entre Hopper y Blackwell, mientras que Trainium quedaría por debajo de H100 en esta métrica concreta.
El dato refuerza que NVIDIA no solo compite por potencia bruta, sino por eficiencia en formatos numéricos cada vez más agresivos. El uso de FP4 en Vera Rubin apunta a modelos donde reducir precisión puede disparar rendimiento y eficiencia, siempre que la calidad del resultado sea suficiente para la carga de IA concreta.
Los ASIC siguen teniendo sentido si el coste por token acompaña
La comparación por vatio no cierra el debate. En inferencia, muchos clientes empiezan a mirar métricas más cercanas al negocio real, como el coste por millón de tokens generados o el coste horario de mantener una GPU en funcionamiento. Ahí los ASIC y aceleradores especializados pueden recuperar terreno frente a NVIDIA.
Un ejemplo citado desde el sector de infraestructura de IA apunta a que los chips de Groq podrían generar tokens con un coste de 5 a 10 céntimos, frente a los 25 céntimos por token asociados a Blackwell. Además, Groq alcanzaría hasta 800 tokens por segundo, por encima de los 450 tokens por segundo estimados para NVIDIA.
Este contraste es clave porque no todas las cargas de IA buscan lo mismo. Para entrenamiento masivo, escalabilidad y ecosistema, NVIDIA mantiene una posición fortísima. Para inferencia muy optimizada, baja latencia o cargas repetitivas, ciertos ASIC pueden ofrecer costes operativos más atractivos si el software encaja bien.
Morgan Stanley: $NVDA «We estimate hyperscaler capex to build a 1 GW datacenter with current-gen NVDA GPUs (Blackwell) is up to ~2x the cost of current-gen custom ASICs (TPU, Trainium)…but compute power efficiency matters, and this is where NVDA shines…with compute… pic.twitter.com/VtAqrcSU9j
— tae kim (@firstadopter) May 18, 2026
La métrica correcta dependerá de cada carga de IA
El debate real no es si NVIDIA o los ASIC son mejores en abstracto. La decisión depende de la carga: entrenamiento, inferencia, modelos multimodales, generación de texto, recomendación, visión o búsqueda. Cada escenario pondera de forma distinta rendimiento por vatio, coste por token, latencia, memoria disponible y facilidad de programación.
Ahí NVIDIA juega con una ventaja muy clara: sirve para muchas cosas y se adapta rápido a modelos cambiantes. Los ASIC suelen destacar cuando la carga está muy definida, pero pierden flexibilidad si el modelo, la precisión o el pipeline cambian. En una industria que evoluciona cada pocos meses, esa flexibilidad tiene mucho valor estratégico.
Por eso, el mayor coste inicial de Blackwell puede justificarse en clientes que necesitan capacidad generalista, despliegue rápido y compatibilidad con múltiples modelos. En cambio, proveedores con cargas muy repetitivas pueden preferir ASIC si consiguen reducir el coste por inferencia, mantener baja latencia y asegurar suficiente disponibilidad de hardware.
NVIDIA mantiene ventaja, pero la presión competitiva aumenta
El informe de Morgan Stanley refuerza la tesis de NVIDIA: sus GPU pueden ser más caras, pero ofrecen una eficiencia de cómputo muy superior en determinadas métricas. Aun así, el mercado ya no evalúa solo los TFLOPS por vatio. La inferencia está empujando indicadores más cercanos al coste operativo real por servicio de IA.
Esto abre espacio para Google, Amazon, Groq y otros fabricantes de aceleradores específicos. Si los ASIC reducen coste por token, mejoran latencia y se integran mejor en nubes propias, pueden ganar cargas concretas aunque no igualen a NVIDIA en flexibilidad general. La batalla de IA será técnica, energética y económica al mismo tiempo.
En conjunto, Blackwell y Rubin refuerzan la posición de NVIDIA en infraestructura de IA, pero también elevan el listón de coste. La pregunta para los hiperescaladores ya no es solo cuánto cuesta comprar el hardware, sino cuánto rendimiento, eficiencia y retorno obtiene cada megavatio instalado. Ahí NVIDIA sigue muy fuerte, aunque los ASIC empiezan a discutirle partes concretas del negocio.
Vía: Wccftech










