NVIDIA ha anunciado un framework de Inteligencia Artificial conversacional, llamado Jarvis y formado por un conjunto de herramientas de software y aprendizaje profundo ya capacitadas que fueron creadas para ayudar a los desarrolladores a crear servicios interactivos de inteligencia artificial conversacional.
Estos modelos pueden producir reconocimiento de voz y comprensión de idiomas en forma precisa. Además ofrecen capacidad de traducción entre diferentes idiomas y conversión de texto a voz. Todos los modelos de Jarvis fueron entrenados vía reuniones web, contenido de vídeo en tiempo real y a través de conversaciones telefónicas.
El entrenamiento llevó varios millones de horas de trabajo de GPU en más de 1.000 millones de páginas de texto, 60.000 horas de datos de voz en diferentes idiomas y acentos.
De acuerdo a NVIDIA estas funciones se pueden desarrollar a través de una canalización de voz de un extremo a otro que puede tardar menos de 100 milisegundos. Además se pueden implementar tanto en el borde, en la nube en sí y hasta en el centro de datos.
De acuerdo a NVIDIA, esto “Abre la puerta a la creación de servicios tales como enfermeras digitales para ayudar a monitorear a los pacientes las 24 horas del día, aliviando al personal médico sobrecargado; asistentes en línea para comprender lo que buscan los consumidores y recomendar los mejores productos, y traducciones en tiempo real para mejorar la colaboración transfronteriza en el lugar de trabajo y permitir que los espectadores disfruten del contenido en vivo en su propio idioma«.
NVIDIA Jarvis ya ha sido utilizado por algunas empresas en su etapa de pruebas, como por ejemplo las empresas T-Mobile y Mozilla Common Voice.
La empresa también anunció que durante este segundo trimestre del año lanzarán nuevas funciones a través del programa beta abierto de NVIDIA Jarvis.