23 noviembre 2024

Model Spec: OpenAI Introduce un Nuevo Marco para el Comportamiento de Modelos de IA

OpenAI lanza una primera versión del «Model Spec», un documento clave sobre cómo deberían de comportarse los modelos de Inteligencia Artificial en general. 

En un esfuerzo por profundizar la conversación pública sobre el comportamiento que deberían tener los modelos de Inteligencia Artificial, OpenAI ha publicado la primera versión del Model Spec, un documento que detalla las directrices para moldear el comportamiento deseado de los modelos en su API y en ChatGPT.

Este lanzamiento es parte del compromiso continuo de la organización para mejorar el comportamiento de los modelos mediante el uso de aportes humanos, complementando su trabajo colectivo de alineación y enfoque sistemático hacia la seguridad de los modelos.

OpenAI Model Spec
Imagen DALL-E

Un enfoque emergente en ciencia del comportamiento de modelos

El comportamiento del modelo, que incluye aspectos como el tono, la personalidad, la longitud de respuesta y más, es crucial para la interacción entre los humanos y las capacidades de la IA.

El Model Spec aborda cómo estos comportamientos son esenciales y aún son parte de una ciencia naciente, ya que los modelos no se programan de manera explícita, sino que aprenden de un amplio rango de datos. Además, al moldear este comportamiento, se deben considerar múltiples preguntas, consideraciones y matices, a menudo equilibrando opiniones divergentes.

El conflicto entre intenciones y prácticas

Aunque la intención de los modelos es ser ampliamente beneficiosos y útiles para los usuarios, estas intenciones pueden entrar en conflicto en la práctica. Por ejemplo, una empresa de seguridad puede desear generar correos electrónicos de phishing como datos sintéticos para entrenar y desarrollar clasificadores que protejan a sus clientes, pero esta misma funcionalidad podría ser perjudicial si es utilizada por estafadores.

Principios y reglas delineadas en el Model Spec

El documento propone objetivos amplios y generales que proporcionan un sentido direccional del comportamiento deseado, como asistir a desarrolladores y usuarios finales, beneficiar a la humanidad respetando las normas sociales y las leyes aplicables, y proteger la privacidad de las personas y los derechos de los creadores.

Las reglas detalladas incluyen seguir la cadena de mando, cumplir con las leyes aplicables, no proporcionar información que pueda ser un riesgo, no responder con contenido NSFW (no seguro para el trabajo), y ser lo más útil posible sin sobrepasar los límites.

¿Cómo se utilizará el Model Spec?

Como continuación de su trabajo en alineación colectiva y seguridad del modelo, OpenAI pretende usar el Model Spec como directrices para los investigadores y entrenadores de IA que trabajan en el aprendizaje reforzado a partir de retroalimentación humana. También se explorará hasta qué punto los modelos pueden aprender directamente del Model Spec.

Lo que sigue

OpenAI ve esto como parte de una conversación pública en curso sobre cómo deberían comportarse los modelos, cómo se determina el comportamiento deseado de los modelos, y cómo involucrar mejor al público general en estas discusiones.

Durante las próximas dos semanas, la organización también invita al público general a compartir sus opiniones sobre los objetivos, reglas y comportamientos predeterminados en el Model Spec, esperando que esto brinde percepciones tempranas mientras desarrollan un proceso robusto para recopilar e incorporar retroalimentación, asegurando así que construyen de manera responsable hacia su misión.

En el próximo año, OpenAI compartirá actualizaciones sobre los cambios en el Model Spec, las respuestas a la retroalimentación recibida y cómo progresa su investigación en el modelado de comportamiento.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos, a través de Instagram para ver nuestras imágenes! O vía Bluesky si ya estás cansado de Twitter

Mariana Cuevas

Mariana es una apasionada por el fitness, fashion, viajar y esto último vaya que lo hizo, ya perdió la cuenta de los países que conoció, especialmente en Europa y Asia. Por supuesto que le gusta todo lo que tiene que ver con Tecnología y los autos en cuanto a comodidad y tecnología para la familia y la mujer!

Ver todas las entradas de Mariana Cuevas →