El reciente crecimiento de la demanda de entrenamiento de grandes modelos lingüísticos («Large Language Models», LLM) como el GPT (Generative Pre-trained Transformer) ha despertado el interés de numerosas empresas por invertir en soluciones de GPU que se utilicen para entrenar dichos modelos. Sin embargo, países como China han tenido que hacer frente a las sanciones de Estados Unidos, y NVIDIA tiene que crear modelos a medida que cumplan la normativa estadounidense en materia de exportación.
Con dos GPUs, H800 y A800, representan versiones recortadas de las originales H100 y A100, respectivamente. Ya informamos sobre la H800; sin embargo, seguía siendo tan enigmática como la A800 de la que hablamos hoy. Gracias a MyDrivers, disponemos de información según la cual el rendimiento de la GPU A800 se sitúa en un 70% del de la A100 estándar.
La GPU A100 estándar gestiona 9,7 TeraFLOPs de FP64, 19,5 TeraFLOPS de FP64 Tensor y hasta 624 BF16/FP16 TeraFLOPS con dispersión. Un cálculo aproximado indicaría que el 70% del rendimiento del original (un recorte del 30%) equivaldría a 6,8 TeraFLOPs de precisión FP64, 13,7 TeraFLOPs de tensor FP64 y 437 BF16/FP16 TeraFLOPs con dispersión.
MyDrivers señala que A800 puede adquirirse por 100.000 yuanes, lo que equivale a unos 14.462 dólares (13.104€) en el momento de redactar este post. No estamos ante la GPU más potente que puedan adquirir las empresas chinas, ya que existe la H800. No obstante, por el momento no disponemos de información sobre su rendimiento.
Vía: TechPowerUp