22 diciembre 2024

Traductor de Google añade 110 nuevos idiomas con IA avanzada

La herramienta de traducción de Google expande su capacidad con el apoyo de la inteligencia artificial, sumando 110 nuevos idiomas y beneficiando a más de medio billón de personas en todo el mundo.

El Traductor de Google ha sido una herramienta esencial para conectar a las personas y permitir una mejor comprensión del mundo que nos rodea. Con la aplicación de las últimas tecnologías, Google ha permitido que más personas accedan a esta herramienta de traducción.

En 2022, se añadieron 24 nuevos idiomas utilizando Zero-Shot Machine Translation, una técnica en la que un modelo de aprendizaje automático aprende a traducir a un nuevo idioma sin haber visto un ejemplo previo.

Además, se anunció la Iniciativa de los 1,000 Idiomas, un compromiso para construir modelos de inteligencia artificial que soporten los 1,000 idiomas más hablados del mundo.

La expansión más grande de Google Translate: 110 nuevos idiomas

Google Translate ha logrado un hito significativo al anunciar la incorporación de 110 nuevos idiomas, gracias al modelo de lenguaje extenso PaLM 2.

Este avance representa la expansión más grande en la historia de Google Translate y amplía el soporte de traducción para más de medio billón de personas en todo el mundo. Desde el cantonés hasta el Qʼeqchiʼ, estos nuevos idiomas abarcan más de 614 millones de hablantes, abriendo la posibilidad de traducción para aproximadamente el 8% de la población mundial.

Algunos de estos idiomas son lenguas principales con más de 100 millones de hablantes, mientras que otros son hablados por pequeñas comunidades indígenas o tienen pocos hablantes nativos, pero están en proceso de revitalización.

Diversidad de idiomas y comunidades representadas

Aproximadamente una cuarta parte de los nuevos idiomas provienen de África, representando la mayor expansión de lenguas africanas hasta la fecha. Entre estos idiomas se incluyen el Fon, Kikongo, Luo, Ga, Swati, Venda y Wolof. Además, se han añadido idiomas como el Afar, una lengua tonal hablada en Djibouti, Eritrea y Etiopía, que ha recibido la mayor cantidad de contribuciones de la comunidad voluntaria.

El cantonés, uno de los idiomas más solicitados para Google Translate, también se incluye en esta expansión. A pesar de que el cantonés a menudo se superpone con el mandarín en la escritura, lo que dificulta la recopilación de datos y el entrenamiento de los modelos, Google ha logrado incorporarlo exitosamente.

Idiomas en peligro de extinción y esfuerzos de revitalización

La inclusión de lenguas como el manés, la lengua celta de la Isla de Man, es un testimonio del compromiso de Google con la preservación de idiomas en peligro de extinción. El manés casi se extinguió con la muerte de su último hablante nativo en 1974, pero gracias a un movimiento de revitalización en la isla, ahora hay miles de hablantes.

Asimismo, el NKo, una forma estandarizada de las lenguas mandingas de África Occidental, ha sido añadido. Esta lengua unifica muchos dialectos en un idioma común y cuenta con una comunidad activa de investigación que desarrolla recursos y tecnología para ella.

El papel de PaLM 2 en la expansión

El modelo de lenguaje extenso PaLM 2 ha sido fundamental para esta expansión, permitiendo que Google Translate aprenda más eficientemente idiomas que están estrechamente relacionados entre sí. Esto incluye lenguas cercanas al hindi, como el awadhi y el marwadi, y criollos franceses como el criollo de Seychelles y el criollo mauriciano.

Cómo se eligen las variedades de idiomas

La adición de nuevos idiomas a Google Translate no es una tarea sencilla. Hay una gran cantidad de variación en los idiomas: variedades regionales, dialectos y diferentes estándares de ortografía. Muchas lenguas no tienen una forma estándar única, por lo que es imposible elegir una variedad «correcta».

Google prioriza las variedades más comúnmente usadas de cada idioma. Por ejemplo, el romani tiene muchos dialectos en toda Europa. Los modelos de Google producen texto que se asemeja más al romani vlax del sur, una variedad comúnmente usada en línea, pero también incluye elementos de otras variedades, como el vlax del norte y el romani balcánico.

Impacto y futuro de Google Translate

Esta expansión de Google Translate no solo beneficia a los hablantes de estos nuevos idiomas, sino que también refleja el compromiso de Google con la inclusión y la diversidad lingüística.

A medida que la tecnología avanza y Google continúa colaborando con lingüistas expertos y hablantes nativos, es probable que se añadan más variedades de idiomas y convenciones ortográficas con el tiempo.

La inclusión de 110 nuevos idiomas en Google Translate, facilitada por el modelo PaLM 2, marca un hito significativo en la eliminación de barreras lingüísticas y la promoción de la comprensión global.

Esta expansión no solo beneficia a más de medio billón de personas, sino que también subraya el compromiso de Google con la diversidad y la preservación de idiomas en peligro de extinción. Con la continua innovación y colaboración, Google Translate seguirá siendo una herramienta esencial para conectar a personas de todo el mundo.

Para más información sobre estos nuevos idiomas, pueden visitar el Centro de Ayuda de Google.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos, a través de Instagram para ver nuestras imágenes! O vía Bluesky si ya estás cansado de Twitter

Hector Russo

Desde su juventud se ha dedicado a la Tecnología de la Información. En su oportunidad fue incluido por Ivy Worldwide en su lista Top 25 influencers en Tecnología. Actualmente es miembro del panel de jurados que elige los mejores vehículos del año para el mercado hispano de Estados Unidos, a través de los Hispanic Motor Press Awards.

Ver todas las entradas de Hector Russo →