Qualcomm HBC apila cómputo bajo LPDDR para romper el muro de memoria en IA

Qualcomm HBC apila cómputo bajo LPDDR para romper el muro de memoria en IA

Qualcomm ha presentado High Bandwidth Compute (HBC), una nueva tecnología para centros de datos de IA que busca atacar el cuello de botella de memoria. La propuesta combina cómputo cercano a memoria, LPDDR apilada e integración 3D, con el objetivo de mejorar ancho de banda, eficiencia energética y coste por token.

La tecnología debutará con HBC Gen 1 en el acelerador Qualcomm Dragonfly AI250, previsto para muestreo comercial a mediados de 2027. Qualcomm promete hasta 133 TB/s por tarjeta, una mejora de 18 veces frente a AI200 con LPDDR5X, antes de escalar a AI300 en 2028.

HBC coloca el cómputo justo debajo de la memoria

La idea central de HBC es reducir la distancia entre cálculo y datos. El acelerador se coloca bajo un stack LPDDR, conectado mediante TSV, para que el movimiento de información sea más corto, más rápido y menos costoso en energía que en diseños tradicionales separados.

Qualcomm define esta arquitectura como una solución de near-memory computing construida en silicio apilado en 3D. El objetivo no es sustituir únicamente a HBM por capacidad, sino repensar cómo se alimentan los aceleradores de IA cuando los modelos necesitan mover cantidades masivas de datos.

La elección de LPDDR resulta clave. Qualcomm apuesta por una memoria más cercana al mundo móvil y portátil, con más capacidad potencial y menor coste que HBM en determinados escenarios. El reto será convertir esa ventaja de capacidad en rendimiento efectivo a escala de centro de datos.

Qualcomm quiere atacar el coste por token

Qualcomm HBC apila cómputo bajo LPDDR para romper el muro de memoria en IA

El discurso técnico de Qualcomm gira alrededor del coste total de propiedad y la métrica de tokens por vatio. En inferencia de IA, no basta con ofrecer mucha potencia bruta, porque cada respuesta generada consume memoria, energía, ancho de banda y capacidad de infraestructura.

Ahí aparece el muro de memoria. Los modelos de lenguaje y multimodales dependen cada vez más del ancho de banda efectivo, especialmente cuando trabajan con agentes, razonamiento continuo, contexto largo y múltiples consultas simultáneas. Si la memoria limita, el acelerador queda infrautilizado.

HBC intenta resolver precisamente esa tensión. Qualcomm promete menor energía por token y mayor ancho de banda efectivo, dos factores que pueden reducir costes operativos en despliegues masivos. Para grandes clientes cloud, esa diferencia puede importar más que ganar un benchmark aislado.

AI250 será la primera prueba real de HBC Gen 1

El primer producto con HBC Gen 1 será Qualcomm Dragonfly AI250, un acelerador de inferencia que llegará después del AI200. La tarjeta promete 133 TB/s de ancho de banda efectivo, una cifra pensada para posicionar a Qualcomm en la conversación frente a GPU, HBM y soluciones con SRAM.

La mejora declarada de 18 veces frente a AI200 con LPDDR5X no debe leerse solo como un salto de memoria. También refleja un cambio de arquitectura, donde el cómputo se acerca al dato para reducir tráfico interno, latencia y consumo asociado al movimiento constante de información.

Este punto resulta importante porque la IA moderna ya no está limitada solo por multiplicaciones. Gran parte del coste está en alimentar los bloques de cálculo, mantener contexto, recuperar datos y sostener concurrencia. HBC intenta que la memoria deje de ser un freno tan caro.

El muestreo comercial previsto para mediados de 2027 deja margen para validación con socios. Qualcomm necesita demostrar rendimiento real en racks, no solo cifras por tarjeta, porque el mercado de inferencia exige estabilidad, software, escalabilidad y costes previsibles.

Qualcomm HBC apila cómputo bajo LPDDR para romper el muro de memoria en IA

AI300 llevará HBC Gen 2 a 2028

La hoja de ruta no termina en AI250. Qualcomm Dragonfly AI300 integrará HBC Gen 2, con un salto adicional de ancho de banda efectivo diseñado para inferencia desagregada. La compañía habla de una mejora de hasta 54 veces frente a AI200, manteniendo la evolución anual de su plataforma.

AI300 también apunta a configuraciones con refrigeración por aire y líquida directa. Eso confirma que Qualcomm piensa en despliegues de rack completos, no en tarjetas aisladas. En centros de datos de IA, el valor está en cómo escalan muchas unidades, no solo en la ficha técnica individual.

El dato de eficiencia es especialmente agresivo. Qualcomm espera entre 4 y 8 veces más rendimiento por vatio frente a arquitecturas GPU existentes, tomando como referencia el ancho de banda por vatio por tarjeta. Es una comparación ambiciosa, aunque dependerá mucho de cargas reales y software.

LPDDR contra HBM: más capacidad y mejor eficiencia si la arquitectura acompaña

La propuesta de Qualcomm no dice que HBM deje de ser potente. HBM seguirá siendo el estándar de referencia para muchos aceleradores de IA. Lo que Qualcomm plantea es que HBM puede encarecer demasiado el coste por token, especialmente cuando consumo y capacidad se convierten en el cuello de botella.

Según la compañía, HBC ofrecería hasta 6 veces más ancho de banda por vatio frente a HBM y hasta 200 veces más capacidad por vatio frente a SRAM, normalizando comparativas a nivel de tarjeta o rack. Son cifras muy fuertes y deberán comprobarse en despliegues comerciales.

La ventaja potencial está en que LPDDR permite jugar con capacidad y eficiencia de otra forma. En inferencia, donde muchos modelos necesitan memoria abundante, contexto largo y uso sostenido, una arquitectura bien resuelta puede resultar más rentable que perseguir solo el máximo ancho de banda bruto.

El riesgo está en la complejidad. Apilar cómputo bajo memoria con TSV e integración 3D no es trivial, y Qualcomm dependerá de socios de fabricación, empaquetado avanzado, validación térmica y rendimiento sostenido. La idea es potente, pero la ejecución será el verdadero examen.

Qualcomm HBC apila cómputo bajo LPDDR para romper el muro de memoria en IA

Qualcomm entra en el centro de datos con una estrategia completa

HBC forma parte de una hoja de ruta más amplia llamada Qualcomm Dragonfly, que incluye CPU C1000, aceleradores AI200, AI250, AI300, conectividad y silicio personalizado. La compañía quiere pasar de proveedor móvil a plataforma completa de infraestructura de IA.

El objetivo financiero también es agresivo. Qualcomm ha elevado su meta de ingresos no móviles para 2029 hasta 40.000 millones de dólares, incluyendo más de 15.000 millones de dólares en centros de datos. Eso sitúa la IA cloud como una pieza central de su diversificación.

Este movimiento no llega en vacío. Reuters señala que Microsoft usará chips HBC de Qualcomm para tareas de IA, mientras Meta empleará la CPU Dragonfly C1000 para centros de datos. La compañía también afirma tener acuerdos con dos hyperscalers para chips personalizados.

El software será tan importante como el silicio

El gran rival indirecto sigue siendo NVIDIA, no solo por sus GPU, sino por su ecosistema. CUDA, librerías, frameworks, herramientas y experiencia de despliegue pesan tanto como el hardware, especialmente en clientes que no quieren rehacer toda su pila de IA.

Qualcomm intenta responder con una plataforma completa y compatibilidad con marcos de IA habituales. La adquisición de Modular también encaja en esa estrategia, porque refuerza la capa de software y puede ayudar a crear una alternativa más abierta, eficiente y menos dependiente de un único proveedor.

La clave será que HBC no se quede en una tecnología brillante sobre diapositivas. Los clientes medirán latencia, throughput, coste por token, facilidad de despliegue, estabilidad y disponibilidad, no solo el ancho de banda teórico. En centros de datos, el rendimiento real manda.

HBC puede ser el giro más serio de Qualcomm hacia la IA cloud

La lectura final es clara: Qualcomm está intentando entrar en IA de centros de datos por un camino distinto al de NVIDIA y AMD. En lugar de competir solo con GPU más grandes, apuesta por memoria eficiente, inferencia, cómputo cercano al dato y menor coste operativo.

Si HBC cumple lo prometido, AI250 y AI300 podrían dar a Qualcomm una posición propia en inferencia a gran escala, especialmente para clientes preocupados por energía, capacidad de memoria y coste por token. No será una batalla sencilla, pero la propuesta técnica tiene sentido.

La incógnita está en el calendario. HBC Gen 1 llegará en 2027 y HBC Gen 2 en 2028, así que Qualcomm todavía debe demostrar producción, software y adopción real. Pero el mensaje ya está claro: la compañía quiere romper el muro de memoria sin depender del camino clásico de HBM.

Vía: Wccftech

Sobre el autor