Antes de Supercomputing ’22 en Dallas, Intel ha presentado la familia de productos Intel Max Series con dos productos de vanguardia para computación de alto rendimiento (HPC) e inteligencia artificial (IA): Intel Xeon CPU Max Series (nombre en clave Sapphire Rapids HBM) e Intel Data Center GPU Max Series (nombre en clave Ponte Vecchio). Los nuevos productos impulsarán la próxima supercomputadora Aurora en el Laboratorio Nacional de Argonne, con actualizaciones sobre su implementación compartidas hoy.
El CPU Xeon Max es el primer y único procesador basado en x86 con memoria de gran ancho de banda, lo que acelera muchas cargas de trabajo HPC sin necesidad de cambios de código. La GPU de la serie Max es el procesador de mayor densidad de Intel, con más de 100 mil millones de transistores en un paquete de 47 mosaicos con hasta 128 GB de memoria de gran ancho de banda. El ecosistema de software abierto oneAPI proporciona un único entorno de programación para ambos nuevos procesadores. Las herramientas oneAPI e IA 2023 de Intel ofrecerán capacidades para habilitar las características avanzadas de los productos de la serie Intel Max.
La computación de alto rendimiento (HPC) representa la vanguardia de la tecnología, empleando las innovaciones más avanzadas a escala para resolver los mayores desafíos de la ciencia y la sociedad, desde mitigar los impactos del cambio climático hasta curar las enfermedades más mortales del mundo.
Los productos de la serie Max satisfacen las necesidades de esta comunidad con CPU y GPU escalables y equilibradas, incorporando avances en el ancho de banda de memoria y unidos por oneAPI, un marco de programación abierto, basado en estándares y de arquitectura cruzada. Los investigadores y las empresas resolverán problemas de forma más rápida y sostenible utilizando los productos de la serie Max.
Los productos de la serie Max están programados para lanzarse en enero de 2023. Cumpliendo con sus compromisos con los clientes, Intel está enviando blades con GPU de la serie Max al Laboratorio Nacional de Argonne para alimentar la supercomputadora Aurora y entregará CPU Xeon Max al Laboratorio Nacional de Los Álamos, la Universidad de Kyoto y otros sitios de supercomputación.
El CPU Xeon Max ofrece hasta 56 núcleos de rendimiento construidos con cuatro mosaicos y conectados mediante la tecnología de puente de interconexión multichip (EMIB) integrada de Intel, en una envolvente de 350 vatios. Los CPUs Xeon Max contienen 64 GB de memoria de gran ancho de banda en el paquete, así como E/S PCI Express 5.0 y CXL1.1. Los CPUs Xeon Max proporcionarán más de 1 GB de capacidad de memoria HBM por núcleo, suficiente para adaptarse a las cargas de trabajo HPC más comunes. El CPU de la serie Max proporciona un rendimiento hasta 4,8 veces mejor en comparación con la competencia en cargas de trabajo HPC del mundo real.
- Un 68 % menos de consumo de energía que un clúster AMD Milan-X para el mismo rendimiento HPCG.
- Las extensiones AMX aumentan el rendimiento de la IA y ofrecen un rendimiento máximo 8 veces superior al AVX-512 para INT8 con operaciones de acumulación INT32.
- Proporciona flexibilidad para ejecutarse en diferentes configuraciones de memoria HBM y DDR.
- Puntos de referencia de la carga de trabajo:
- Modelado climático: 2,4 veces más rápido que AMD Milan-X en MPAS-A utilizando solo HBM.
- Dinámica molecular: En DeePMD, mejora del rendimiento 2,8 veces frente a productos de la competencia con memoria DDR.
Las GPUs de la serie Max ofrecen hasta 128 núcleos e-HPC, la nueva arquitectura fundamental dirigida a las cargas de trabajo informáticas más exigentes. Además, la GPU de la serie Max incluye:
- 408 MB de caché L2, la más alta de la industria, y 64 MB de caché L1 para aumentar el rendimiento y el rendimiento.
- La única GPU HPC/AI con aceleración de trazado de rayos nativa, diseñada para acelerar la visualización y animación científica.
- Puntos de referencia de la carga de trabajo:
- Finanzas: 2,4 veces más rendimiento sobre el A100 de NVIDIA en los precios de la opción de crédito Riskfuel.
- Física: mejora de 1,5 veces sobre A100 para simulaciones de reactores virtuales NekRS.
Las GPUs de la serie Max estarán disponibles en varios formatos para satisfacer las diferentes necesidades de los clientes:
- GPU Max Series 1100: una tarjeta PCIe de doble ancho de 300 vatios con 56 núcleosX e y 48 GB de memoria HBM2e. Se pueden conectar varias tarjetas a través de puentes Intel Xe Link.
- GPU Max Series 1350: módulo OAM de 450 vatios con 112 núcleosX e y 96 GB de HBM.
- GPU Max Series 1550: módulo OAM de 600 vatios de rendimiento máximo de Intel con 128 núcleosX e y 128 GB de HBM.
Más allá de las tarjetas y módulos individuales, Intel ofrecerá el subsistema Intel Data Center GPU Max Series con placa portadora x4 GPU OAM e Intel Xe Link para permitir la comunicación multi-GPU de alto rendimiento dentro del subsistema.
En 2023 se espera que el superordenador Aurora, actualmente en construcción en el Laboratorio Nacional de Argonne, se convierta en el primer superordenador en superar 2 exaflops de rendimiento máximo de cómputo de doble precisión. Aurora también será el primero en mostrar el poder de emparejar GPU y CPU de la serie Max en un solo sistema, con más de 10,000 blades, cada uno con seis GPUs de la serie Max y dos CPUs Xeon Max.
Antes de SC22, Argonne e Intel presentaron Sunspot, el sistema de desarrollo de pruebas de Aurora que consta de 128 blades de producción. Los investigadores del Programa de Ciencia Temprana de Aurora tendrán acceso al sistema a partir de finales de 2022.
Los productos de la serie Max impulsarán varios otros sistemas HPC críticos para la seguridad nacional y la investigación básica, incluyendo Crossroads en el Laboratorio Nacional de Los Álamos, los sistemas CTS-2 en el Laboratorio Nacional Lawrence Livermore y el Laboratorio Nacional Sandia, y el Alcanfor3 en la Universidad de Kioto.
En Supercomputing ’22, Intel y sus clientes mostrarán más de 40 próximos diseños de sistemas de 12 fabricantes de equipos originales que utilizan productos de la serie Max. Los asistentes pueden explorar demostraciones que muestran el rendimiento y la capacidad de los productos de la serie Max para una amplia gama de aplicaciones de IA y HPC, así como escuchar a los arquitectos, clientes y usuarios finales de Intel sobre el poder de las soluciones de plataforma de Intel en el stand de Intel, # 2428. Más información sobre las actividades de Intel en SC22 está disponible.
La GPU Intel Data Center Max Series, cuyo nombre en código es Rialto Bridge, es la sucesora de la GPU Max Series y está destinada a llegar en 2024 con un rendimiento mejorado y un camino perfecto para la actualización. Intel planea lanzar la próxima gran innovación de arquitectura para permitir el futuro de HPC. El próximo XPU de la compañía, cuyo nombre en clave es Falcon Shores, combinará núcleos Xe y x86 en un solo paquete. Esta nueva arquitectura innovadora también tendrá la flexibilidad de integrar nuevas IP de Intel y clientes, fabricadas con su modelo IDM 2.0.