COLE, un nuevo sistema que combina múltiples modelos de inteligencia artificial para generar diseños gráficos editables, tiene el potencial para poder marcar un hito en el campo del diseño gráfico.
El mundo del diseño gráfico está experimentando un cambio fundamental con la introducción de COLE, un sistema innovador que combina múltiples modelos de inteligencia artificial (IA) para crear diseños gráficos editables bajo demanda.
Este avance, desarrollado por un equipo de 12 investigadores de Microsoft Research Asia y la Universidad de Pekín, representa un cambio potencialmente disruptivo en la industria del diseño gráfico.
COLE: El Diseñador Gráfico Profesional
COLE permite a los usuarios introducir una idea de proyecto de diseño gráfico y obtener un resultado en el que la IA no solo genera la imagen, sino también el texto correspondiente. El sistema utiliza versiones afinadas de distintos modelos de IA conocidos como GPT-4V, LLaVA1.5, LLama2 y otros, además de Skia, un renderizador gráfico de código abierto.
Una de las características más destacadas de COLE es su capacidad para generar imágenes con bloques de texto y objetos editables dentro de la imagen. Esto permite a los usuarios modificar fácilmente elementos específicos dentro de la imagen, sin necesidad de recurrir a programas externos como Adobe Photoshop o InDesign. Por ejemplo, los usuarios pueden cambiar el texto mostrado, la fuente o incluso modificar los elementos visuales, como transformar una bolsa de supermercado de una imagen fotorrealista a un dibujo animado.
El equipo de COLE entrenó su modelo de IA con 100,000 imágenes de diseño gráfico de alta calidad obtenidas de internet. Aunque actualmente se considera más un marco de trabajo que un producto finalizado, los resultados obtenidos han sido impresionantes, siendo capaces de generar diseños gráficos nítidos y organizados que combinan elementos visuales con texto estilizado.
Los investigadores han probado COLE en 200 proyectos de diseño gráfico diferentes, desde publicidad hasta promociones de eventos y materiales de marketing. Los resultados han demostrado ser de una calidad muy competitiva, incluso en comparación con generadores de arte AI líderes en el mercado, como DALL-E 3 de OpenAI. Sin embargo, COLE todavía tiene limitaciones, como la incapacidad para cambiar la disposición de los bloques de tipografía, o la inclusión de múltiples bloques de tipografía en un diseño y actualmente solo permite un color de tipografía por imagen.
Aunque COLE presenta un avance significativo en la generación de diseño gráfico con IA, no parece que vaya a reemplazar completamente a los diseñadores gráficos en el corto plazo. Los investigadores diseñaron el sistema para producir imágenes con campos editables, lo que permite a los usuarios refinar la salida e integrar la experiencia humana cuando sea necesario. Esto sugiere que la formación en diseño gráfico seguirá siendo útil para obtener los mejores resultados del marco de trabajo de la IA.
Actualmente, COLE no está disponible para el público en general, pero los investigadores han anunciado que una demostración estará disponible próximamente en su página web del proyecto en Github.
En resumen, COLE representa un avance emocionante en el campo del diseño gráfico, combinando la versatilidad de la inteligencia artificial con la creatividad humana. Aunque aún está en desarrollo, su potencial para transformar la forma en que se crean y editan los diseños gráficos es indiscutible, abriendo nuevas posibilidades para profesionales y aficionados por igual.
Por más información pueden consultar el documento de COLE publicado en el sitio de Arxiv de la Universidad Cornell.