18 diciembre 2024

Google utiliza IA para ofrecer descripción de imágenes a no videntes

Google desarrolla una función en Chrome que utiliza algoritmos de Inteligencia Artificial para para ofrecer la descripción de imágenes y gráficos a no videntes.

Desde hace rato personas ciegas o poca visión dependen de lectores de pantalla para conocer el contenido de páginas web a través de comentarios hablados o braille.

Con el texto no existen muchos problemas y cuando se trata de audio, como por ejemplo la publicación de un podcast en una página web o un vídeo, pero en el caso de las imágenes y gráficos, los lectores de pantalla no son eficientes por si solos, dependen de descripciones que son creadas por diseñadores, desarrolladores y autores a través de lo que se conoce como Atributos o Texto Alternativo en el código de la página web.

Google-Logo

Lamentablemente existen millones de imágenes y gráficos en la web que no poseen ninguna descripción, por lo que los usuarios ciegos o con poca visión deben conformarse con escuchar la palabra Imagen o gráfico sin etiquetar y en otros casos el nombre del archivo que muchas veces no describen la imagen y tienen nombres de fichero como por ejemplo «IMG041018».

Por suerte en un artículo en su blog, Google señala que, pensando en mejorar esa experiencia, crearon una función de descripción de imágenes automática, a través de inteligencia artificial, la cual se llama Get Image Descriptions from Google (Obtener Descripciones de Imágenes de Google).

Gracias a esta función para el navegador Chrome, cuando una imagen no tiene descripción, el navegador creará una.

Google aclara que la descripción de imágenes generadas de esta forma no son tan buenas como las escritas por un humano, el cual muchas veces agrega contexto adicional.  Igualmente son más precisas y útiles que el no tener descripción.

Como ejemplo de esta función, Google señala que lad descripción de una imagen puede ayudar a una persona ciega a leer el menú de un restaurante o comprender mejor las publicaciones en redes sociales.

El proceso de descripción automática creado por Google cuando está activo, si encuentra una imagen sin descripción, la envía de forma segura a un servidor de Google con software de aprendizaje automático, el cual  agrega información de acuerdo a lo que aprendió de múltiples modelos de aprendizaje automático.

Entre esos modelos tenemos los que buscan texto en la imagen, los que buscan objetos como por ejemplo un árbol, persona, lápiz o cualquier otra cosa en la imagen que le permita identificar y así crear la descripción.  Google también comenta que «el modelo más sofisticado puede describir la idea principal de una imagen usando una oración completa».

Ahora no todas las descripciones son ofrecidas al usuario, ya que el sistema también evalúa la precisión e información.  Solo brindan la descripción cuando el modelo determina que debe de mostrarse y si no está completamente seguro, puede ofrecer una descripción básica o directamente no ofrecer ninguna.

Esa descripción es simple, pero de gran ayuda cuando en otro caso la persona no tendría descripción o una descripción que sería el nombre del fichero compuesto de letras y números sin tener relación con la imagen en sí.

Por último la empresa de Mountain View señala que en los últimos meses crearon más de 10 millones de descripciones con cientos de miles agregadas diariamente. Por ahora esta función solo funciona para el idioma inglés, pero prometen que pronto incorporarán más idiomas.

Aclaran que esta función no fue creada para reemplazar las descripciones de imágenes en páginas web escritas por humanos. Google hace hincapié en recomendar a los diseñadores, desarrolladores o autores que sigan las mejores prácticas al crear páginas incluyendo la descripción en las imágenes y gráficos.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos, a través de Instagram para ver nuestras imágenes! O vía Bluesky si ya estás cansado de Twitter

Hector Russo

Desde su juventud se ha dedicado a la Tecnología de la Información. En su oportunidad fue incluido por Ivy Worldwide en su lista Top 25 influencers en Tecnología. Actualmente es miembro del panel de jurados que elige los mejores vehículos del año para el mercado hispano de Estados Unidos, a través de los Hispanic Motor Press Awards.

Ver todas las entradas de Hector Russo →