11 diciembre 2024

Google lanza Gemini 2.0, su modelo de IA más avanzado

Google lanza Gemini 2.0, su modelo de IA más avanzado, con capacidades multimodales y herramientas innovadoras para transformar la interacción humano-máquina.

Hoy Google lanzó Gemini 2.0, su modelo de inteligencia artificial más avanzado hasta la fecha, diseñado para la «era de los agentes«.

Este modelo destaca por sus capacidades multimodales, uso nativo de herramientas y avances en razonamiento, lo que lo posiciona como una pieza clave en la evolución de la inteligencia artificial.

Sundar Pichai, CEO de Google y Alphabet, resaltó que esta tecnología redefine el uso de la IA, haciendo posible una interacción más útil, personalizada y segura.

Google Gemini 2.0
Imagen Google

El salto hacia la «era de los agentes»

Gemini 2.0 representa un paso significativo en la evolución de los modelos de inteligencia artificial. Mientras que Gemini 1.0 se enfocó en organizar y comprender información a través de entradas multimodales como texto, video, imágenes y código, su sucesor se orienta hacia aplicaciones más prácticas y dinámicas.

Sundar Pichai describió esta etapa como el inicio de la «era de los agentes», donde la IA puede pensar múltiples pasos adelante, comprender su entorno y actuar bajo supervisión humana.

Nuevas capacidades de Gemini 2.0

Entre las innovaciones destacadas, Gemini 2.0 introduce la generación nativa de imágenes, audio y texto, permitiendo una interacción más rica y natural.

Además, incluye un nuevo modelo experimental llamado Gemini 2.0 Flash, optimizado para baja latencia y alta eficiencia. Según Google, este modelo supera a su predecesor Gemini 1.5 Pro en velocidad y precisión, marcando un hito en el desempeño de modelos IA.

Una de las funciones más prometedoras es Deep Research, un asistente de investigación avanzado que explora temas complejos, compila informes y resuelve problemas intrincados, incluyendo ecuaciones matemáticas avanzadas y consultas multimodales.

Aplicaciones en productos Google

Gemini 2.0 ya está transformando productos clave de Google como Search, potenciando las populares «AI Overviews» que alcanzan a más de mil millones de usuarios. Estas capacidades se están probando en mercados seleccionados y se espera una expansión global a principios del próximo año.

Asimismo, la integración de Gemini 2.0 se extiende a aplicaciones como NotebookLM y Gemini app, su asistente de IA, que pronto ofrecerán experiencias más inmersivas y personalizadas.

Proyectos innovadores: Astra, Mariner y Jules

Google también está explorando nuevas fronteras con tres proyectos experimentales impulsados por Gemini 2.0:

  1. Project Astra: Un asistente universal con capacidades de memoria mejoradas y herramientas como Google Lens y Maps. Astra está siendo probado en dispositivos Android y próximamente en gafas prototipo.
  2. Project Mariner: Un agente diseñado para navegar y ejecutar tareas en navegadores web, combinando razonamiento multimodal y funciones avanzadas de interacción con la interfaz de usuario.
  3. Jules: Un asistente para desarrolladores que integra inteligencia artificial en flujos de trabajo de GitHub, ayudando a planificar, ejecutar y supervisar tareas complejas.

Construcción responsable y segura

Según Demis Hassabis, CEO de Google DeepMind, la compañía está adoptando un enfoque gradual y supervisado para mitigar riesgos y garantizar la responsabilidad en el desarrollo de IA. Entre las medidas implementadas destacan:

  • Entrenamiento avanzado en detección de riesgos y generación de datos de mitigación.
  • Controles de privacidad, como la eliminación de sesiones de usuario en Project Astra.
  • Protecciones contra inyecciones maliciosas de instrucciones en Project Mariner.

Perspectivas futuras

Gemini 2.0 no solo redefine la interacción humano-máquina, sino que también explora nuevas aplicaciones en videojuegos y robótica. Por ejemplo, el modelo puede generar mundos tridimensionales a partir de imágenes y actuar como asistente en videojuegos, colaborando con desarrolladores como Supercell.

En robótica, las capacidades de razonamiento espacial de Gemini 2.0 prometen avances en la interacción con el entorno físico, aunque aún se encuentra en etapas iniciales.

Gemini 2.0 marca un hito en la inteligencia artificial al combinar capacidades avanzadas con un enfoque ético y responsable. A medida que este modelo se integre en más productos y sectores, promete redefinir la relación entre humanos y tecnología. La «era de los agentes» está aquí y con ella, un futuro lleno de posibilidades transformadoras.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos, a través de Instagram para ver nuestras imágenes! O vía Bluesky si ya estás cansado de Twitter

Hector Russo

Desde su juventud se ha dedicado a la Tecnología de la Información. En su oportunidad fue incluido por Ivy Worldwide en su lista Top 25 influencers en Tecnología. Actualmente es miembro del panel de jurados que elige los mejores vehículos del año para el mercado hispano de Estados Unidos, a través de los Hispanic Motor Press Awards.

Ver todas las entradas de Hector Russo →