Con Medprompt, Microsoft Research está ampliando las capacidades de los modelos de inteligencia artificial mediante técnicas avanzadas de prompting.
En el ámbito de la inteligencia artificial, Microsoft Research ha dado un paso significativo al desarrollar técnicas avanzadas para dirigir modelos de IA, con un enfoque particular en su iniciativa Medprompt.
Esta estrategia ha demostrado ser eficaz no solo en tareas médicas, sino también en una amplia gama de desafíos de conocimiento general.
Proyecto Medprompt
Los modelos de inteligencia artificial, especialmente los modelos de base, están mostrando capacidades sorprendentes en áreas como la abstracción, generalización y composición en diversos campos del conocimiento.
Lo que hace que Medprompt sea particularmente notable es su habilidad para utilizar prompts (indicaciones o preguntas) directas y simples, conocidas como zero-shot prompts, para dirigir estos modelos hacia tareas específicas. Este enfoque ha impresionado incluso a los investigadores más experimentados en IA.
Medprompt y otras estrategias relacionadas se están compilando en un recurso en GitHub llamado promptbase, que pretende proporcionar herramientas y conocimientos a ingenieros y clientes para maximizar el rendimiento de los modelos de IA.
Estas estrategias se han aplicado para evaluar y mejorar modelos como GPT-4, alcanzando resultados notables en benchmarks como el MMLU (Measuring Massive Multitask Language Understanding), un desafío establecido para probar el conocimiento general y la capacidad de razonamiento de los modelos de lenguaje a gran escala.
En estudios recientes, el uso de Medprompt en GPT-4 en el MMLU logró una puntuación del 89.1%. Aumentando el número de llamadas en Medprompt, la puntuación aumentó al 89.56%. Luego, se desarrolló una versión mejorada llamada Medprompt+, que combina métodos de prompting simples con los de Medprompt base. Esta nueva versión permitió a GPT-4 alcanzar una puntuación récord del 90.10% en el MMLU.
La importancia de estas investigaciones radica en la capacidad de los modelos de IA para adaptarse y mejorar a través de técnicas de prompting innovadoras.
Mientras Microsoft Research continúa explorando el rendimiento «fuera de la caja» de modelos como GPT-4, se abre un panorama emocionante para futuras aplicaciones y desarrollos en el campo de la inteligencia artificial. La comunidad científica y los desarrolladores de IA pueden encontrar más detalles y herramientas en el repositorio promptbase en GitHub.