La competencia en inteligencia artificial está al rojo vivo, y Anthropic no se ha quedado atrás en esta carrera tecnológica. La empresa de Dario Amodei ha dado un gran paso al presentar sus nuevos modelos Claude Opus 4 y Claude Sonnet 4, con los que busca revolucionar el ámbito de la IA.
El foco del anuncio recae en Claude Opus 4, considerado el modelo más avanzado desarrollado por Anthropic hasta la fecha. La compañÃa no escatima en afirmaciones y lo describe como «el mejor modelo de programación del mundo». Una declaración osada que deberá ser comprobada en el tiempo, pero las primeras pruebas lo colocan bien posicionado frente a sus competidores más cercanos.
En el benchmark SWE-bench Verified, que mide el desempeño en tareas prácticas de ingenierÃa de software, Opus 4 alcanza un 72,5 % bajo condiciones normales, y puede llegar al 79,4 % con procesamiento paralelo. Este rendimiento lo sitúa por delante de modelos como GPT-4.1 (54,6 %), o3 (69,1 %) y el reciente Gemini 2.5 Pro de Google (63,2 %).
Sin embargo, en pruebas más complejas en razonamiento multimodal, como GPQA Diamond o MMMU, enfocadas en preguntas universitarias y escenarios que fusionan texto e imagen, Opus 4 aún no supera a o3, que sigue manteniéndose en la cima en ese aspecto.
Resistencia y autonomÃa en un mismo modelo
Más allá de los números, Anthropic pone énfasis en la resistencia y autonomÃa de este modelo. Claude Opus 4 destaca por su capacidad de mantener sesiones de trabajo prolongadas y ejecutar miles de pasos de manera continua. Según la compañÃa, esto lo convierte en la base perfecta para desarrollar agentes de IA más avanzados, capaces de tomar decisiones y completar tareas de forma autónoma, sin necesidad de supervisión humana constante.
Junto a Opus 4, llega Claude Sonnet 4, una evolución del modelo lanzado por Anthropic en febrero. Aunque no compite en potencia con Opus, ofrece una excelente combinación entre rendimiento y eficiencia. En términos de codificación, ha mejorado significativamente respecto a su predecesor, pasando del 62,3 % al 72,7 % en SWE-bench Verified, y ha refinado su capacidad de razonamiento, seguimiento de instrucciones y precisión.
Ambos modelos incorporan avances notables. Ahora son capaces de alternar entre razonamiento y uso de herramientas en un solo proceso, ofreciendo respuestas más completas. También han incrementado su fiabilidad: son un 65 % menos propensos a atajos o errores graves que el Sonnet 3.7, según Anthropic.
Claude Opus 4 y Sonnet 4 ya están disponibles en la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI. Están incluidos en los planes Pro, Max, Team y Enterprise. Los precios se mantienen en lÃnea con los modelos anteriores: Opus 4 cuesta 15 dólares por millón de tokens de entrada y 75 por millón de tokens de salida. Sonnet 4 es más económico: 3 y 15 dólares respectivamente, siendo también accesible desde cuentas gratuitas.
Imágenes | Anthropic
Deja una respuesta