NVIDIA afina el modelo Llama3.1 para batir a GPT-4o y Claude 3.5 Sonnet con sólo 70.000 millones de parámetros

La compañía norteamericana NVIDIA ha publicado de forma oficial su modelo Llama-3.1-Nemotron-70B-Instruct. El modelo Nemotron, basado en Llama3.1 70B de META, consiste en un gran modelo de lenguaje personalizado por NVIDIA para mejorar la utilidad de las respuestas generadas por LLM. Para ello, NVIDIA utiliza datos estructurados de ajuste fino que dirigen el modelo y … NVIDIA afina el modelo Llama3.1 para batir a GPT-4o y Claude 3.5 Sonnet con sólo 70.000 millones de parámetros