En una notable expansión de su accesibilidad y funcionalidad, Gemini 1.5 Pro se ha lanzado globalmente en más de 180 países, tras su introducción inicial hace menos de dos meses en Google AI Studio.
Gemini 1.5 Pro es un modelo de vanguardia que ha demostrado ser una herramienta invaluable para la comunidad de desarrolladores, permitiendo avances significativos en la depuración, creación y aprendizaje con su innovadora ventana de contexto de 1 millón.
Este lanzamiento representa un salto cualitativo en la capacidad de procesamiento de datos, particularmente con la introducción de la comprensión nativa de audio (habla) y una nueva API de archivos, facilitando a los desarrolladores la gestión de archivos de manera más eficiente.
Junto con estas mejoras, Gemini 1.5 Pro incorpora características como instrucciones del sistema y un modo JSON, brindando a los desarrolladores herramientas avanzadas para personalizar y controlar la salida del modelo según sus necesidades específicas. Además, se ha mejorado el modelo con la inclusión de un nuevo modelo de incrustación de texto de última generación, que ha demostrado superar a los modelos comparables en rendimiento.
Gemini 1.5 Pro, Novedades Más Notables
Nuevas posibilidades con la comprensión de audio y vídeo
La actualización más emocionante para muchos será la ampliación de las modalidades de entrada para incluir la comprensión de audio, tanto en la API de Gemini como en Google AI Studio.
Esta capacidad permite a Gemini 1.5 Pro procesar y razonar a partir de datos tanto de imagen como de audio en videos, lo que abre nuevas avenidas para aplicaciones de inteligencia artificial.
La promesa de agregar soporte de API para estas capacidades en el futuro cercano solo aumenta su potencial.
Mejoras orientadas a los desarrolladores en la API de Gemini
El lanzamiento también aborda varias de las principales peticiones de los desarrolladores:
- Instrucciones del sistema: Permiten guiar las respuestas del modelo con instrucciones precisas, facilitando la personalización para casos de uso específicos.
- Modo JSON: Ofrece una salida exclusiva de objetos JSON, optimizando la extracción de datos estructurados.
- Llamadas de función mejoradas: Proporcionan opciones para limitar las salidas del modelo y aumentar su fiabilidad y precisión.
Avance con el nuevo modelo de incrustación de texto
El lanzamiento de Gemini 1.5 Pro incluye el acceso a un avanzado modelo de incrustación de texto, que establece nuevos estándares en rendimiento de recuperación y supera a modelos de dimensiones comparables en las pruebas de referencia MTEB. Esta mejora es un testimonio del compromiso continuo con la innovación y el avance tecnológico.
La disponibilidad de Gemini 1.5 Pro en más de 180 países a través de la API de Gemini no solo amplía el alcance global de la herramienta sino que también refuerza su posición como un pilar fundamental en el desarrollo de soluciones de inteligencia artificial.
Los desarrolladores interesados han sido invitados por Google a explorar las capacidades mejoradas de Gemini 1.5 Pro en Google AI Studio, donde pueden acceder a ejemplos de código, guías rápidas y unirse a una comunidad vibrante de innovadores en el canal de Discord.
Este lanzamiento es solo el comienzo de una serie de mejoras planificadas para Gemini API y Google AI Studio, señalando un futuro emocionante para el desarrollo de aplicaciones de inteligencia artificial.