NVIDIA lleva la IA generativa a millones de personas con GPU Tensor Core, LLM, herramientas para PC RTX y estaciones de trabajo

NVIDIA lleva la IA generativa a millones de personas con GPU Tensor Core, LLM, herramientas para PC RTX y estaciones de trabajo

NVIDIA ha anunciado hoy las GPU de escritorio GeForce RTX SUPER, que aseguran un rendimiento de IA generativa sobrealimentado, nuevos portátiles con IA de la mano de los principales fabricantes y nuevas herramientas IA aceleradas con NVIDIA RTX, tanto para desarrolladores como para consumidores.

Basándose en décadas de liderazgo en la industria del PC, con más de 100 millones de GPU RTX impulsando la era de los ordenadores con IA, NVIDIA ofrece ahora las siguientes herramientas para mejorar las experiencias en PC usando la IA generativa: aceleración con NVIDIA TensorRT del popular modelo Stable Diffusion XL para flujos de trabajo de texto a imagen, NVIDIA RTX Remix con herramientas para generar texturas usando la IA generativa, los microservicios NVIDIA ACE y nuevos juegos que utilizan la tecnología DLSS 3 con Frame Generation.

Además, NVIDIA TensorRT-LLM (TRT-LLM), una biblioteca de código abierto que acelera y optimiza el rendimiento de inferencia de los últimos modelos lingüísticos grandes (LLM), ahora admite más modelos preoptimizados para PC. Acelerada por TRT-LLM, Chat with RTX es una demostración técnica de NVIDIA que se lanzará este mes y que permite a los entusiastas de la IA interactuar con sus notas, documentos y otros contenidos.

«La IA generativa es la transición de plataforma más significativa en la historia de la computación y transformará todas las industrias, incluidos los videojuegos», dijo Jensen Huang, fundador y CEO de NVIDIA. «Con más de 100 millones de PC y estaciones de trabajo con IA RTX, NVIDIA se erige como una gran base para que los desarrolladores y los jugadores disfruten de la magia de la IA generativa».

La ejecución local de la IA generativa en un PC es fundamental para la privacidad, la latencia y las aplicaciones sensibles a los costes. Requiere una gran base instalada de sistemas preparados para la IA, así como las herramientas de desarrollo adecuadas para ajustar y optimizar los modelos de IA en un ordenador.

Para satisfacer estas necesidades, NVIDIA está ofreciendo innovaciones en toda su oferta tecnológica, impulsando nuevas experiencias y aprovechando las más de 500 aplicaciones y juegos de PC habilitados para IA acelerados por la tecnología NVIDIA RTX.

PC y estaciones de trabajo con IA RTX

Las GPU NVIDIA RTX, capaces de ejecutar una amplia gama de aplicaciones con el máximo rendimiento, liberan todo el potencial de la IA generativa en PC. Los núcleos tensoriales de estas GPU aceleran drásticamente el rendimiento de la IA en las aplicaciones más exigentes para trabajar y jugar.

Las nuevas tarjetas gráficas GeForce RTX 40 SUPER Series, también anunciadas hoy en el CES, incluyen la GeForce RTX 4080 SUPER, 4070 Ti SUPER y 4070 SUPER para un rendimiento de IA superior. La GeForce RTX 4080 SUPER genera vídeo con IA 1,5 veces más rápido, e imágenes 1,7 veces más rápido que la GPU GeForce RTX 3080 Ti. Los núcleos Tensor de las GPU SUPER ofrecen hasta 836 billones de operaciones por segundo, lo que aporta capacidades de IA transformadoras a los juegos, a la creación y a la productividad diaria.

Los principales fabricantes, incluidos Acer, ASUS, Dell, HP, Lenovo, MSI, Razer y Samsung, lanzarán una nueva oleada de portátiles RTX AI, brindando a los usuarios un conjunto completo de utilidades con IA generativa desde el primer momento. Los nuevos sistemas, que ofrecen un aumento de rendimiento que oscila entre 20 y 60 veces en comparación con el uso de unidades de procesamiento neuronal, comenzarán a enviarse este mes.

Las estaciones de trabajo móviles con GPU RTX pueden ejecutar el software NVIDIA AI Enterprise, incluyendo TensorRT y NVIDIA RAPIDS para un desarrollo simplificado y seguro de la IA generativa y la ciencia de datos. Con cada GPU activa NVIDIA A800 de 40 GB, se incluye una licencia de tres años para NVIDIA AI Enterprise, lo que proporciona una plataforma de desarrollo de estaciones de trabajo ideal para IA y ciencia de datos.

Nuevas herramientas de desarrollo en PC para crear modelos de IA

Para ayudar a los desarrolladores a crear, probar y personalizar rápidamente modelos de IA generativa preentrenados y LLM utilizando el rendimiento de los ordenadores, NVIDIA anunció recientemente NVIDIA AI Workbench, un kit de herramientas unificado y fácil de usar.

AI Workbench, que se lanzará en versión beta a finales de este mes, ofrece acceso optimizado a repositorios populares como Hugging Face, GitHub y NVIDIA NGC, junto con una interfaz de usuario simplificada que permite a los desarrolladores reproducir, colaborar y migrar proyectos fácilmente.

Los proyectos se pueden escalar horizontalmente a prácticamente cualquier lugar, ya sea el centro de datos, una nube pública o NVIDIA DGX Cloud y, luego, volver a los sistemas RTX locales en un PC o estación de trabajo para la inferencia y la personalización ligera.

En colaboración con HP, NVIDIA también está simplificando el desarrollo de modelos de IA mediante la integración de NVIDIA AI Foundation Models and Endpoints, que incluyen modelos de IA acelerados por RTX y kits de desarrollo de software en HP AI Studio, una plataforma centralizada para la ciencia de datos. Esto permitirá a los usuarios buscar, importar e implementar fácilmente modelos optimizados en PC y en la nube.

Después de crear modelos de IA, los desarrolladores pueden optimizarlos con NVIDIA TensorRT para aprovechar al máximo los Tensor Cores de las GPU RTX.

Recientemente, NVIDIA amplió TensorRT a aplicaciones basadas en texto con TensorRT-LLM para Windows, una biblioteca de código abierto para acelerar los LLM. La última actualización de TensorRT-LLM, ya disponible, agrega Phi-2 a la creciente lista de modelos preoptimizados para PC, que se ejecutan hasta 5 veces más rápido en comparación con otros backends de inferencia.

La IA generativa acelerada por RTX impulsa nuevas experiencias en PC

En CES, NVIDIA y sus socios desarrolladores han lanzado nuevas aplicaciones y servicios impulsados por IA generativa para PC, entre los que se incluyen:

  • NVIDIA RTX Remix, una plataforma para crear impresionantes remasterizaciones RTX de juegos clásicos. Lanzado en versión beta a finales de este mes, ofrece herramientas de IA generativa que pueden transformar texturas básicas de juegos clásicos en materiales de renderizado modernos, a resolución 4K y basados en la física.
  • Microservicios NVIDIA ACE, que incluyen modelos generativos de voz y animación impulsados por IA, permitiendo a los desarrolladores agregar avatares digitales inteligentes y dinámicos a los juegos.
  • Aceleración TensorRT para los modelos de Stable Diffusion XL (SDXL) Turbo y latent consistency, dos de los métodos de aceleración de Stable Diffusion más populares. TensorRT mejora el rendimiento de ambos hasta en un 60 % en comparación con la implementación más rápida anterior. También está disponible una versión actualizada de la extensión TensorRT de Stable Diffusion WebUI, que incluye aceleración para SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) y compatibilidad mejorada con LoRA.
  • NVIDIA DLSS 3 con Frame Generation, que utiliza la IA para aumentar la velocidad de fotogramas hasta 4 veces en comparación con el renderizado nativo, aparecerá en una docena de los 14 nuevos juegos RTX anunciados, entre los que se incluyen Horizon Forbidden West, Pax Dei y Dragon’s Dogma 2.
  • Chat with RTX, una demostración técnica de NVIDIA disponible a finales de este mes, permite a los entusiastas de la IA conectar fácilmente los LLM de PC a sus propios datos utilizando una técnica popular conocida como generación aumentada de recuperación (RAG). La demostración, acelerada por TensorRT-LLM, permite a los usuarios interactuar rápidamente con sus notas, documentos y otros contenidos. También estará disponible como un proyecto de referencia de código abierto, para que los desarrolladores puedan implementar fácilmente las mismas capacidades en sus propias aplicaciones.

Sobre el autor