14 septiembre 2024

Gemini avanza con Gems personalizables y mejoras en Imagen 3

Gemini, la plataforma de inteligencia artificial de Google, expande sus capacidades con la introducción de Gems personalizables y un modelo mejorado de generación de imágenes, Imagen 3, disponible para usuarios avanzados y empresariales en más de 150 países.

Google ha comenzado el despliegue de dos importantes actualizaciones para su plataforma de inteligencia artificial Gemini: la capacidad de crear Gems personalizados similares a los GPT de OpenAI, disponible para suscriptores avanzados, y la introducción de Imagen 3, un modelo de generación de imágenes mejorado, que estará accesible para todos los usuarios de Gemini.

Estas nuevas funciones, presentadas originalmente en Google I/O, buscan ofrecer una experiencia más personalizada y creativa a los usuarios.

Gems: expertos personalizados en la palma de tu mano

A partir de hoy, los suscriptores de Gemini Advanced, Business y Enterprise pueden empezar a crear y utilizar Gems, una nueva característica que permite personalizar la IA para actuar como un experto en cualquier tema deseado. Los Gems, que fueron presentados inicialmente durante Google I/O, son versiones personalizadas de Gemini que los usuarios pueden adaptar para satisfacer necesidades específicas, desde asistencia en la codificación hasta la planificación de carreras profesionales.

Los usuarios pueden crear un Gem simplemente proporcionando instrucciones detalladas y un nombre, lo que les permitirá interactuar con este «experto» en cualquier momento. Google ha diseñado estos Gems para ayudar en tareas complejas o repetitivas, brindando la posibilidad de ahorrar tiempo y mejorar la eficiencia. Entre los Gems preconfigurados que estarán disponibles, se incluyen un coach de aprendizaje, un generador de ideas, un guía de carrera, un editor de escritura y un compañero de codificación.

Esta nueva funcionalidad permitirá a los usuarios contar con un equipo de expertos virtuales que pueden ayudar en una amplia gama de tareas, desde desglosar temas complicados hasta sugerir ideas creativas para eventos o brindar retroalimentación sobre escritos. La función de Gems estará disponible tanto en dispositivos de escritorio como móviles, en más de 150 países y en la mayoría de los idiomas.

Imagen 3: un salto en la generación de imágenes

Otra novedad significativa es la implementación de Imagen 3, el más reciente modelo de generación de imágenes de Google, que estará disponible para todos los usuarios de Gemini en los próximos días. Imagen 3 representa un avance en la calidad de las imágenes generadas por IA, permitiendo a los usuarios crear imágenes de alta calidad con solo unas pocas palabras.

Este modelo no solo genera imágenes en diversos estilos, como paisajes fotorrealistas, pinturas al óleo con texturas o escenas de plastilina, sino que también integra salvaguardas para garantizar un uso responsable de la tecnología. Según Google, Imagen 3 ha demostrado un rendimiento favorable en comparación con otros modelos de generación de imágenes disponibles en el mercado, y, al igual que su predecesor Imagen 2, utiliza la herramienta SynthID para marcar las imágenes generadas por IA con una marca de agua, manteniendo así la transparencia en la creación de contenido digital.

Uno de los aspectos más destacados de Imagen 3 es la capacidad del usuario de mantener el control total sobre el proceso creativo. Si la imagen inicial no cumple con las expectativas del usuario, Gemini puede generar nuevas versiones basadas en las indicaciones proporcionadas. Esta función se ampliará próximamente para incluir la generación de imágenes de personas, aunque inicialmente solo estará disponible para usuarios avanzados y empresariales en inglés.

Desafíos y salvaguardas en la generación de imágenes

Google ha trabajado en mejoras técnicas para Imagen 3, enfocándose en la precisión y la ética de la generación de imágenes. Aunque el modelo ha avanzado significativamente, Google enfatiza que no admite la creación de individuos fotorrealistas y reconocibles, representaciones de menores o escenas gráficas de violencia o contenido sexual explícito. La empresa subraya que, si bien no todas las imágenes generadas serán perfectas, se compromete a seguir refinando el modelo basado en la retroalimentación de los usuarios iniciales.

El despliegue de estas nuevas funciones forma parte de un esfuerzo continuo de Google por mejorar y expandir las capacidades de su plataforma de IA, con la promesa de ofrecer una experiencia más rica y personalizada para sus usuarios. A medida que estas funciones se implementen, se espera que más usuarios y lenguajes se vean beneficiados en un futuro cercano.

Con la introducción de Gems personalizables y el modelo mejorado de generación de imágenes Imagen 3, Google continúa su expansión en el ámbito de la inteligencia artificial, ofreciendo herramientas que permiten a los usuarios personalizar su experiencia y mejorar la creatividad digital.

Estas nuevas características están disponibles inicialmente para suscriptores avanzados y empresariales, marcando un paso más en la evolución de las capacidades de Gemini y estableciendo nuevas posibilidades para la interacción con la inteligencia artificial.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos y a través de Instagram para ver nuestras imágenes!

Mariana Cuevas

Mariana es una apasionada por el fitness, fashion, viajar y esto último vaya que lo hizo, ya perdió la cuenta de los países que conoció, especialmente en Europa y Asia. Por supuesto que le gusta todo lo que tiene que ver con Tecnología y los autos en cuanto a comodidad y tecnología para la familia y la mujer!

Ver todas las entradas de Mariana Cuevas →