21 noviembre 2024

Llemma, nuevo modelo de lenguaje de IA para problemas matemáticos [código abierto]

Eleuther AI, una empresa conocida por sus modelos de inteligencia artificial de código abierto ha anunciado el lanzamiento de LLEMMA, un modelo grande de lenguaje (LLM, por sus siglas en inglés) capaz de resolver problemas matemáticos complejos.

LLEMMA se basa en Code Llama, una adaptación del modelo Llama 2 de Meta y está entrenado en Proof-Pile-2, un nuevo conjunto de datos relacionados con matemáticas creado por los investigadores.

Llama en la clase - Llemma
Imagen Microsoft Image Creator

Este nuevo modelo de Inteligencia Artificial puede realizar diversas tareas matemáticas, como utilizar herramientas computacionales, demostrar teoremas formales y responder preguntas de matemáticas. Los investigadores afirman que LLEMMA supera a otros modelos de lenguaje enfocados en matemáticas, incluido el Minerva de Google, que no es de código abierto.

LLEMMA también demuestra las ventajas de los modelos de lenguaje específicos de dominio, que pueden lograr mejores resultados con menores costos computacionales que los modelos de propósito general.

Los investigadores han puesto a disposición del público todos sus activos, incluidas las versiones de LLEMMA con 7 mil millones y 34 mil millones de parámetros, el conjunto de datos Proof-Pile-2 y el código para replicar sus experimentos. Esperan que LLEMMA y Proof-Pile-2 inspiren trabajos futuros para mejorar las capacidades matemáticas de los modelos de lenguaje y utilizarlos como herramientas para matemáticos.

LLEMMA es parte de una iniciativa más amplia para desarrollar LLM especializados para diferentes campos y dominios. Los investigadores creen que resolver problemas matemáticos requiere comparación de patrones con un gran cuerpo de conocimiento previo especializado, y que los modelos de lenguaje capaces de un fuerte razonamiento matemático pueden habilitar nuevos temas de investigación en IA.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos, a través de Instagram para ver nuestras imágenes! O vía Bluesky si ya estás cansado de Twitter

Hector Russo

Desde su juventud se ha dedicado a la Tecnología de la Información. En su oportunidad fue incluido por Ivy Worldwide en su lista Top 25 influencers en Tecnología. Actualmente es miembro del panel de jurados que elige los mejores vehículos del año para el mercado hispano de Estados Unidos, a través de los Hispanic Motor Press Awards.

Ver todas las entradas de Hector Russo →

Un comentario en «Llemma, nuevo modelo de lenguaje de IA para problemas matemáticos [código abierto]»

Los comentarios están cerrados.