NVIDIA ha empezado a entregar sus primeras plataformas Quantum-X InfiniBand con fotónica de silicio y óptica co-empaquetada CPO, una tecnología que apunta directamente al gran problema de las fábricas de IA: mover datos entre miles de GPUs sin disparar consumo, latencia ni puntos de fallo.
La primera unidad recibida por Lambda no es solo otro switch de alta velocidad. Quantum-X Q3450-LD representa un cambio físico en cómo se construye la red interna de los clústeres de IA, acercando la óptica al motor de conmutación para reducir pérdidas, módulos externos y energía desperdiciada.
La red ya pesa tanto como la GPU en una fábrica de IA
En los clústeres modernos, la GPU sigue siendo el componente más visible, pero la red interna decide cuánta potencia puede aprovecharse realmente. Si los datos no se mueven con suficiente velocidad entre nodos, el rendimiento cae, la inferencia se ralentiza y parte del hardware queda esperando.
Lambda asegura que el tejido trasero de red ya supone el 86% del consumo de networking en un clúster de tres capas. Ese dato cambia la lectura del problema. Optimizar la red deja de ser una mejora secundaria y pasa a ser una forma directa de liberar potencia para más cómputo útil.
Ahí encaja la apuesta de NVIDIA. La fotónica de silicio con CPO intenta reducir el coste energético de mover datos, no solo aumentar el ancho de banda. En IA agéntica, donde los sistemas generan más tráfico entre GPUs, memoria y nodos, esa eficiencia puede ser tan importante como añadir más aceleradores.
📣 Get a first look at the NVIDIA Photonics co-packaged optics switch with @LambdaAPI.
At NVIDIA GB300 NVL72 scale, the network doesn’t just move data between GPUs — it determines how fast your cluster thinks. Co-packaged optics cut switch power, reduce failure points, and… pic.twitter.com/yF5b6HLTuB
— NVIDIA AI Infrastructure (@NVIDIAAIInfra) June 10, 2026
Quantum-X Q3450-LD cambia la arquitectura del switch
El NVIDIA Quantum-X Q3450-LD utiliza un formato 4U, integra el ASIC Quantum-X800 y ofrece 144 puertos InfiniBand de 800G mediante conectores MPO. Su capacidad total alcanza 115,2 Tb/s sin bloqueo, una cifra pensada para racks donde la comunicación entre GPUs es constante.
La diferencia frente a un switch tradicional está en la integración óptica. En lugar de depender de jaulas OSFP y transceptores discretos por cada enlace, el diseño emplea conexiones de fibra que alimentan directamente el motor de fotónica de silicio, reduciendo componentes intermedios y complejidad física.
Menos consumo significa más margen para computación
El impacto energético es el punto más importante. Una solución de switching convencional ronda los 7,0 kW, mientras que la propuesta con fotónica de silicio baja a 3,95 kW. Ese ahorro de 3,05 kW por switch puede reasignarse a GPUs dentro del mismo presupuesto eléctrico.
A pequeña escala ya se nota. Un clúster GB300 NVL72 de 576 GPUs con 12 switches CPO liberaría unos 37 kW, equivalente a unas 26 GPUs adicionales. La cifra no es simbólica: la red deja de consumir margen que podría estar generando tokens, entrenando modelos o ejecutando inferencia.
En despliegues grandes, la diferencia se vuelve enorme. Con 4.608 GPUs, el ahorro subiría a 305 kW, equivalente a 217 GPUs. Con 41.472 GPUs y 1.440 switches, NVIDIA habla de 4.392 kW liberados, una cantidad comparable a 3.137 GPUs adicionales dentro del mismo centro de datos.
CPO también ataca el problema de la fiabilidad
El consumo no es el único punto crítico. Lambda indica que un centro de datos de 128.000 GPUs puede usar 655.000 módulos transceptores discretos en su tejido de conmutación. Cada transceptor añade coste, mantenimiento y una posible fuente de fallo en una infraestructura que debe operar sin interrupciones.
La óptica co-empaquetada reduce parte de esa exposición al mover componentes ópticos más cerca del sistema principal. Menos módulos discretos significan menos piezas que sustituir, menos fallos intermitentes y menos presión operativa sobre equipos de mantenimiento, algo clave cuando la escala deja de ser humana.
Este punto suele quedar por detrás del rendimiento bruto, pero en IA industrial importa muchísimo. Un clúster puede tener miles de GPUs disponibles y aun así perder eficiencia si la red acumula fallos, degradaciones o enlaces problemáticos. CPO busca mejorar rendimiento, pero también disponibilidad.
Los módulos de luz externos facilitan el mantenimiento
Las muestras de ingeniería enviadas a Lambda integran 18 módulos de fuente de luz extraíbles, cada uno asociado a ocho puertos. Esta decisión resulta importante porque NVIDIA no integra todo de forma completamente cerrada, sino que mantiene una parte óptica reemplazable para facilitar servicio y continuidad operativa.
El diseño intenta equilibrar integración y mantenimiento. La fibra entra directamente hacia el motor de fotónica de silicio, pero las fuentes de luz pueden gestionarse como módulos externos. En infraestructuras de gran escala, esa separación puede reducir tiempos de reparación sin abandonar las ventajas de CPO.
Refrigeración líquida y 48V para racks de alta densidad
En la parte trasera, el switch utiliza alimentación 48V DC mediante conectores busbar compatibles con entornos DGX. La refrigeración se apoya en cuatro conexiones líquidas UDQ4 con doble circuito interno, una elección lógica para una plataforma que combina alta densidad, óptica integrada y conmutación masiva.
Este diseño está claramente alineado con racks GB300 NVL72 y plataformas Blackwell Ultra. NVIDIA quiere que Quantum-X encaje dentro de infraestructuras ya preparadas para refrigeración líquida y distribución eléctrica de alta densidad, evitando que la red se convierta en un elemento separado y difícil de integrar.
La IA agéntica obliga a repensar el tejido de red
La expansión de la IA agéntica cambia el tipo de tráfico dentro del centro de datos. Ya no hablamos solo de entrenar modelos en lotes enormes. Los agentes generan más ciclos de consulta, más intercambio entre nodos y más presión sobre la comunicación interna, especialmente cuando se busca mayor rendimiento por token.
Por eso la red se está convirtiendo en una ventaja competitiva. Quien reduzca consumo, latencia y fallos en el tejido InfiniBand podrá meter más cómputo útil en el mismo espacio físico, algo decisivo cuando energía, refrigeración y disponibilidad de suelo técnico ya limitan la expansión de nuevas fábricas de IA.
NVIDIA refuerza su control sobre toda la infraestructura de IA
La lectura final es clara: NVIDIA no solo está vendiendo GPUs, está cerrando el círculo de la infraestructura completa de IA. Con Blackwell Ultra, InfiniBand, Quantum-X, refrigeración líquida, software y CPO, la compañía intenta controlar cada capa que determina el rendimiento real del centro de datos.
Para Lambda, recibir una de las primeras plataformas Quantum-X con fotónica de silicio significa reducir consumo y complejidad en una parte crítica del clúster. Para NVIDIA, el mensaje es todavía más importante: la próxima guerra de la IA no se ganará solo con más GPUs, sino con redes más eficientes, resilientes y escalables.
Vía: Wccftech













