AMD lanzó ayer martes el procesador de servidor de alta densidad EPYC 9004 «Bergamo» de 128 núcleos/256 hilos y, con él, debutó la nueva microarquitectura de CPU «Zen 4c«.
Mucho se había dicho sobre Zen 4c en el periodo previo al lanzamiento de ayer, como los rumores de que es un núcleo Zen 4 «lite» que tiene menos músculo numérico, y por lo tanto menor IPC, y que Zen 4c es la respuesta de AMD a las arquitecturas de núcleo E de Intel, como «Gracemont» y «Crestmont». Resulta que no se trata ni de una versión lite del Zen 4 ni de un núcleo E, sino de una versión físicamente compactada del núcleo Zen 4, con idéntica maquinaria de cálculo numérico.
Para empezar, Zen 4c tiene exactamente el mismo IPC que Zen 4 (es decir, rendimiento a una frecuencia determinada). Esto se debe a que su front-end, etapa de ejecución, componente de carga/almacenamiento y jerarquía de caché interna son exactamente idénticas. Tiene la misma cola de carga de 88 profundidades, la misma cola de almacenamiento de 64 profundidades, la misma caché de 675.000 µop, exactamente el mismo ancho de emisión INT+FP de 10+6, exactamente el mismo archivo de registro INT, el mismo planificador y las mismas latencias de caché. Las cachés L1I y L1D tienen el mismo tamaño de 32 KB que el «Zen 4», al igual que la caché L2 dedicada, de 1 MB.
Lo único que ha cambiado es que la caché L3 efectiva por núcleo se ha reducido a 2 MB, frente a los 4 MB del CCD «Zen 4» de 8 núcleos. Mientras que el CCD «Zen 4» estándar de 8 núcleos cuenta con ocho núcleos «Zen 4» que comparten una caché L3 de 32 MB, el nuevo CCD «Zen 4c» de 16 núcleos que AMD ha presentado con «Bergamo» incluye dos CCX (CPU core complexes) de 8 núcleos, cada uno con 16 MB de caché L3 compartidos entre los 8 núcleos del CCX. En este sentido, la caché de último nivel y la organización del núcleo del CPU del CCD «Zen 4c» presentan algunas similitudes con el CCD «Zen 2» (que utilizaba dos CCXs de 4 núcleos).
Lo interesante es que la APU «Zen 4c» de 16 núcleos no es el primer producto de AMD de esta generación con menor caché de último nivel por núcleo. El silicio de la APU «Phoenix» utilizado en los procesadores portátiles Ryzen 7040 permite que ocho núcleos «Zen 4» compartan una caché L3 de 16 MB. Para cargas de trabajo de cálculo matemático intensivo con menor huella de memoria, «Zen 4c» ofrece un rendimiento idéntico a «Zen 4«; sin embargo, la menor caché L3 debería afectar al rendimiento en cargas de trabajo sensibles al ancho de banda con grandes conjuntos de datos.
El CCD Zen 4c está basado exactamente en el mismo nodo de fundición EUV de 5 nm de TSMC en el que la compañía fabrica su CCD Zen 4 de 8 núcleos; sin embargo, el núcleo del CPU Zen 4c es un 35% más pequeño que el núcleo Zen 4, con un área de die (por núcleo) de sólo 2,48 mm², frente a 3,84 mm². El ahorro en el tamaño del die se debe probablemente a que AMD ha «compactado» los distintos componentes del núcleo sin reducir en absoluto su forma o función.
Como hemos indicado antes, los recuentos de los distintos componentes del núcleo siguen siendo los mismos, al igual que los tamaños de las cachés µ-op, L1 y L2. El EPYC 9004 «Bergamo» alcanza su recuento de 128 núcleos empleando ocho de estos CCDs Zen 4c de 16 núcleos. Comparativamente, el procesador «Genoa» estándar alcanza los 96 núcleos con doce CCDs Zen 4 de 8 núcleos.
Vía: TechPowerUp