Al verse en apuros con los procesadores AMD EPYC «Genoa», Intel está dando a su procesador Xeon Scalable de 4ª generación «Sapphire Rapids» una sucesión bastante pronta en forma del Xeon Scalable «Emerald Rapids«, previsto para el cuarto trimestre de 2023 (dentro de unos 8-10 meses).
El nuevo procesador comparte la misma plataforma e infraestructura LGA4677 y gran parte de la misma E/S, pero incorpora dos cambios de diseño clave que deberían ayudar a Intel a mejorar el rendimiento por núcleo, haciéndolo competitivo frente a los procesadores EPYC «Zen 4» con mayor número de núcleos.
Semi Analysis recopiló una buena descripción general de los cambios, cuyos dos puntos más destacados son los siguientes: 1. Intel está dando marcha atrás en el enfoque de chiplet para CPU con un elevado número de núcleos, y 2., que quiere proporcionar al subsistema de memoria y al rendimiento entre núcleos un incremento masivo del rendimiento utilizando cachés de mayor tamaño en el chip.
El procesador «Emerald Rapids» solo cuenta con dos dies de gran tamaño en su versión XCC (extreme core-count), frente a los «Sapphire Rapids», que pueden tener hasta cuatro. Estos dos dies están interconectados por solamente tres EMIB, frente a los «Sapphire Rapids», que necesitan hasta 10 para garantizar rutas directas entre los cuatro dies.
El número de núcleos del CPU en sí no experimenta un notable aumento. Cada uno de los dos dies de «Emerald Rapids» cuenta físicamente con 33 núcleos de CPU, por lo que hay un total de 66 físicamente presentes, aunque un núcleo por die se deja sin usar para la recolección. Por tanto, el número máximo de núcleos posible comercialmente es de 32 núcleos por die, o 64 núcleos por socket. «Emerald Rapids» sigue basándose en el proceso Intel 7 (10 nm Enhanced SuperFin), probablemente con algunas mejoras de arquitectura para frecuencias más elevadas.
Como hemos señalado antes, la E/S resulta casi idéntica entre «Sapphire Rapids» y «Emerald Rapids». El procesador proporciona cuatro enlaces UPI de 20 GT/s para la comunicación entre sockets. Cada uno de los dos dies posee un PCI Express Gen 5 root-complex con 48 líneas, pero sólo 40 de ellas están conectadas. Por tanto, el procesador ofrece un total de 80 líneas PCIe Gen 5.
Se trata de un recuento idéntico al de «Sapphire Rapids», que ofrecía 32 líneas por chiplet, 128 en total, pero solo se conectarían 20 líneas por die. La interfaz de memoria es la misma, con el procesador dotado de una interfaz DDR5 de 8 canales, pero la velocidad de la memoria nativa se actualiza a DDR5-5600, frente a la actual DDR5-4800.
Mientras que «Sapphire Rapids» utiliza variantes empresariales de los núcleos de CPU «Golden Cove» que tienen 2 MB de cachés L2 dedicados, «Emerald Rapids» utiliza los núcleos más recientes «Raptor Cove» que también impulsan los procesadores cliente Intel Core de 13ª generación. Cada uno de los 66 núcleos dispone de 2 MB de caché L2 dedicada.
Sin embargo, la novedad es que cada núcleo alberga un amplio segmento de 5 MB de caché L3, en comparación con la «Golden Cove» de la compañía, que únicamente dispone de un segmento de 1,875 MB, lo que supone un enorme incremento del 166%.
La cantidad máxima de caché L3 posible en un procesador «Sapphire Rapids» de 60 núcleos es de 112,5 MB, mientras que para el modelo superior «Emerald Rapids» de 64 núcleos, dicha cantidad es de 320 MB, lo que supone un incremento del 184%. Intel también ha aumentado el tamaño de los filtros snoop de caché por núcleo.
Semi Analysis también calculó que, a pesar de estar basado en el mismo proceso Intel 7 que «Sapphire Rapids», a Intel le costaría menos fabricar un procesador «Emerald Rapids» con un número de núcleos ligeramente superior y cachés mucho mayores.
Sin las líneas de trazado, los cuatro dies que componen «Sapphire Rapids» suman 1.510 mm² de área de die, mientras que los dos dies que componen «Emerald Rapids» solo suman 1.493 mm². Intel calcula que puede crear todas las unidades SKU basadas en el número de núcleos de CPU asignando al procesador 1 o 2 dies, y no necesita 4 de ellos para una segmentación más precisa de los SKU. AMD utiliza hasta doce CCDs «Zen 4» de 8 núcleos para lograr su recuento de 96 núcleos.
Vía: TechPowerUp