d-Matrix presenta 3DIMC, la primera DRAM 3D en producción masiva para acelerar la IA generativa

d-Matrix presenta 3DIMC, la primera DRAM 3D en producción masiva para acelerar la IA generativa

El fabricante d-Matrix ha revelado los primeros detalles de su nueva generación de aceleradores para IA generativa, un movimiento que buscaría competir directamente con el dominio actual de NVIDIA en el segmento de infraestructura. El nuevo diseño basado en DRAM 3D apilada (3DIMC) sería el eje de la próxima arquitectura de inferencia de la marca, posicionándose como una alternativa a las soluciones basadas en HBM4. El actual Corsair C8, la primera compute card dedicada de d-Matrix, tuvo una recepción positiva, pero la compañía estaría lista para reemplazarlo con un modelo superior que aprovecharía la primera DRAM 3D producida en masa del mundo. Este salto tecnológico llegaría en un momento clave, dado que la demanda de hardware de inferencia sigue creciendo de forma exponencial.

Para desarrollar esta nueva memoria, d-Matrix ha trabajado con el integrador taiwanés AIchip, especializado en soluciones ASIC para infraestructura de IA de alto rendimiento. La tecnología 3DIMC (3D stacked digital in-memory compute) permitiría resolver los cuellos de botella de latencia, ancho de banda y eficiencia presentes en las arquitecturas actuales. La integración de lógica y memoria en un único bloque tridimensional reduciría drásticamente los desplazamientos de datos, uno de los mayores lastres del hardware de IA moderno. Las primeras pruebas de la 3DIMC se estarían llevando a cabo en los chips Pavehawk, la plataforma experimental de d-Matrix destinada a validar arquitecturas avanzadas de inferencia.

Una memoria 3D para romper los límites de la infraestructura de IA

La propuesta 3DIMC sería especialmente relevante porque ofrecería ventajas frente a los módulos HBM4, tanto en eficiencia como en coste y densidad. d-Matrix afirma que esta memoria podría multiplicar por 10 el rendimiento de inferencia respecto a los aceleradores basados en HBM4, un avance que cambiaría completamente la ecuación energética y la escalabilidad en centros de datos. La capacidad de ejecutar operaciones directamente “dentro” de la memoria —sin transferencias externas— permitiría reducir latencias críticas para modelos de gran tamaño y cargas generativas complejas.

La adopción de 3DIMC también supondría un paso adelante en sostenibilidad, ya que reduciría el consumo derivado del movimiento de datos, del tráfico entre memoria y lógica. Esto sería crucial en una industria donde los modelos multimodales, los sistemas generativos y las arquitecturas agentic consumen enormes cantidades de energía durante la inferencia continua.

Raptor sería el primer acelerador comercial con DRAM 3D apilada

El primer producto comercial basado en esta tecnología sería el nuevo Raptor, el acelerador de inferencia destinado a reemplazar la serie Corsair. La compañía describe Raptor como una solución diseñada para cargas intensivas y modelos generativos de gran escala, ofreciendo un salto considerable sobre los Corsair C8 actuales. El anuncio también menciona explícitamente la referencia al ecosistema NVIDIA Jetson AGX, indicando que Raptor competiría directamente con plataformas de inferencia compactas y de alta eficiencia energética.

d-Matrix presenta 3DIMC, la primera DRAM 3D en producción masiva para acelerar la IA generativa

Un avance estratégico para competir con NVIDIA

Para d-Matrix, este movimiento supone una oportunidad crítica para ganar terreno frente a NVIDIA, cuyo dominio en GPUs, aceleradores y software sigue siendo casi absoluto. El cofundador y CEO Sid Sheth describe la DRAM 3D como “un avance que hace que la IA sea más rápida, más rentable y más sostenible a escala”. Según la compañía, esta arquitectura sería el paso lógico hacia aceleradores capaces de seguir el ritmo del crecimiento exponencial de la IA generativa y de los futuros modelos agentic.

La combinación de 3DIMC, procesado dentro de la memoria y aceleradores como Raptor, podría inaugurar una nueva etapa en hardware de inferencia optimizado, especialmente para empresas que buscan alternativas más eficientes y menos dependientes de NVIDIA.

Vía: NotebookCheck

Sobre el autor