24 octubre 2024

Claude 3.5 con Importantes Novedades y la IA Toma el Control de Ordenadores

Anthropic actualiza Claude 3.5 Sonnet con mejoras en codificación y lanza Claude 3.5 Haiku, junto con una beta innovadora para el uso de computadoras.

Anthropic ha lanzado importantes actualizaciones y novedades en su línea de modelos de inteligencia artificial Claude. La compañía presentó una versión mejorada de Claude 3.5 Sonnet, que ofrece avances significativos en comparación con su predecesor.

Además, Anthropic anunció un nuevo modelo llamado Claude 3.5 Haiku, que se destaca por su velocidad y costo accesible, junto con la introducción en beta pública de una revolucionaria capacidad de «uso de computadoras», que permite a los desarrolladores dirigir a Claude para que interactúe con las computadoras como lo haría un ser humano.

Impressionism - DALL-E
Imagen DALL-E

Claude 3.5 Sonnet: Potencia en Codificación

La versión mejorada de Claude 3.5 Sonnet muestra avances en todas las áreas, pero destaca especialmente en tareas de codificación. Según las pruebas realizadas por Anthropic, este modelo supera a todos los sistemas disponibles públicamente en benchmarks específicos de codificación y uso de herramientas.

En el SWE-bench Verified, por ejemplo, su desempeño aumentó de un 33.4% a un 49.0%, superando incluso a sistemas especializados en codificación avanzada como OpenAI o1-preview.

La empresa ha colaborado con clientes como GitLab para probar el nuevo modelo en tareas de DevSecOps, reportando un incremento del 10% en habilidades de razonamiento sin aumentar la latencia. Otros clientes, como Cognition, han experimentado mejoras notables en codificación, planificación y resolución de problemas, superando los resultados de versiones anteriores.

Claude 3.5 Haiku: Rapidez y Eficiencia

El nuevo modelo Claude 3.5 Haiku, que se lanzará este mes, es una actualización del modelo más rápido de la generación anterior. Comparado con Claude 3 Opus, Haiku 3.5 iguala su rendimiento en múltiples evaluaciones, pero con un costo y velocidad similares a su predecesor, Claude 3 Haiku.

Se ha destacado en tareas de codificación, obteniendo un 40.6% en el SWE-bench Verified, superando a agentes que usan modelos públicos de última generación.

Anthropic planea que este modelo esté disponible en su API, en Amazon Bedrock y en Vertex AI de Google Cloud. Inicialmente será solo de texto, pero se espera que se amplíe a entradas de imágenes en el futuro cercano.

Uso de Computadoras: Innovación en Beta Pública

La funcionalidad más revolucionaria que Anthropic ha lanzado en beta pública es la capacidad de uso de computadoras. Claude 3.5 Sonnet es el primer modelo que permite a los desarrolladores dirigir sus acciones para interactuar con una computadora, utilizando interfaces de usuario y software estándar de la misma forma que lo haría una persona. Esta característica permite automatizar procesos repetitivos, probar software y realizar tareas abiertas como la investigación.

Anthropic menciona que la beta aún es experimental y presenta ciertas limitaciones, como la dificultad para realizar acciones aparentemente sencillas como desplazar, arrastrar o hacer zoom. No obstante, empresas como Asana, Canva y Replit ya han comenzado a probar esta función para optimizar sus procesos y productos, indicando que podría tener un impacto significativo en la eficiencia y la autonomía de la inteligencia artificial.

Seguridad y Ética en el Uso de IA

Para garantizar un uso seguro de estas nuevas capacidades, Anthropic ha realizado pruebas en conjunto con el Instituto de Seguridad en IA de EE.UU. (US AISI) y su homólogo en el Reino Unido (UK AISI). La compañía sigue aplicando sus políticas de escalado responsable y ha evaluado los riesgos potenciales de este modelo.

Además, han desarrollado clasificadores que permiten identificar el uso de la capacidad de uso de computadoras y detectar cualquier actividad malintencionada.

Mirando al Futuro

Anthropic se muestra entusiasta sobre las posibilidades que abrirán estas nuevas herramientas y capacidades. La compañía ha invitado a los desarrolladores a experimentar con la beta pública y a proporcionar retroalimentación para mejorar y evolucionar la tecnología. El objetivo a largo plazo es entender mejor el potencial y las implicaciones de sistemas de IA cada vez más avanzados.

La nueva versión de Claude 3.5 Sonnet ya está disponible para todos los usuarios a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Por su parte, Claude 3.5 Haiku se lanzará en las próximas semanas, continuando con la expansión y mejora de la línea de productos de inteligencia artificial de Anthropic.

Anthropic sigue como uno de los líderes en el desarrollo de inteligencia artificial avanzada con sus modelos Claude 3.5 Sonnet y Haiku. Las mejoras en codificación y la innovación en el uso de computadoras representan un paso significativo hacia la automatización de tareas complejas, ofreciendo a los desarrolladores nuevas herramientas para explorar el potencial de estas tecnologías.

Siguenos por Twitter a través de @Geeksroom y no te pierdas todas las noticias, cursos gratuitos y demás artículos. También puedes seguirnos a través de nuestro canal de Youtube para ver nuestros vídeos y a través de Instagram para ver nuestras imágenes!

Hector Russo

Desde su juventud se ha dedicado a la Tecnología de la Información. En su oportunidad fue incluido por Ivy Worldwide en su lista Top 25 influencers en Tecnología. Actualmente es miembro del panel de jurados que elige los mejores vehículos del año para el mercado hispano de Estados Unidos, a través de los Hispanic Motor Press Awards.

Ver todas las entradas de Hector Russo →