NVIDIA libera Audio2Face como modelo open-source para animación facial 3D

NVIDIA ha dado un paso importante en el terreno de la animación digital al liberar como open-source su modelo Audio2Face, una tecnología diseñada para generar avatares 3D realistas a partir de audio. El sistema combina modelos de vídeo generativo, motores de texto a voz y modelos de lenguaje de gran escala en una misma tubería, creando personajes digitales capaces de expresarse en tiempo real.

Un pipeline completo para avatares

El funcionamiento de Audio2Face parte del análisis de la señal acústica, desglosando elementos como entonación y fonemas. Estos datos se convierten en información de animación que se mapea sobre un modelo 3D, generando expresiones faciales que transmiten emociones de manera visual. El sistema puede trabajar en modo offline para contenidos guionizados o en tiempo real, logrando sincronización labial dinámica y gesticulación adaptada a la voz del usuario.

La compañía no solo libera el modelo, sino también el SDK y el framework de entrenamiento completo, lo que permite a desarrolladores y entusiastas personalizar sus propios avatares. Además, se han facilitado plugins para Autodesk Maya y Unreal Engine, integrando la tecnología directamente en flujos de trabajo profesionales de animación 3D.

Aplicaciones prácticas en videojuegos y producción

Estudios de desarrollo y creadores de herramientas están adoptando Audio2Face como un atajo de producción para animación facial, reduciendo la necesidad de trabajar frame a frame. Compañías como Reallusion, Survios o The Farm 51 aseguran que esta solución acelera la creación de cinemáticas y narrativas interactivas, a la vez que mantiene la autenticidad de los personajes.

El modelo puede generar lip-sync multilingüe y expresiones adaptadas al contexto, permitiendo que los equipos dediquen más tiempo al pulido artístico y menos a tareas repetitivas. Con esta apertura al ecosistema, se amplían las posibilidades para integrar avatares realistas tanto en videojuegos, entornos virtuales o aplicaciones sociales, marcando un nuevo estándar en animación generada por IA.

Vía: TechPowerUp

Desarrollo

Noticia

NVIDIA

Software

Tecnología

NVIDIA libera Audio2Face como modelo open-source para animación facial 3D

Un pipeline completo para avatares

Aplicaciones prácticas en videojuegos y producción

Sobre el autor

Reviews más recientes

Un pipeline completo para avatares

Aplicaciones prácticas en videojuegos y producción

Sobre el autor

Entradas relacionadas

QNAP lanza la QXG-100G2SF-BCM, una tarjeta PCIe de red con doble 100 Gbps

Sony WF-1000XM6 adelantarían su lanzamiento y llegarían el 12 de febrero

Samsung Galaxy Tab A11 Plus ya disponible en EE. UU. con precio ajustado

Reviews más recientes