Claude 4 Opus reconocido como el mejor del mundo para codificación, superando a Gemini y OpenAI o3

Anthropic presentó la 4ta generación de la inteligencia artificial Claude. ¡Estoy gratamente impactado! La nueva línea incluye 2 modelos – Opus 4 y Sonnet 4. Ambos modelos demuestran un nivel fundamentalmente nuevo de trabajo con programación y tareas de agentes.

Claude Opus 4 se posiciona como el mejor modelo del mundo para trabajar con código. La característica principal es la capacidad de mantener rendimiento estable al ejecutar tareas complejas a largo plazo. El modelo puede trabajar continuamente en una tarea durante horas, manteniendo el enfoque en el contexto original.

Claude Sonnet 4 representa una actualización significativa de la versión anterior 3.7. El modelo muestra capacidades mejoradas en programación y pensamiento lógico, mientras sigue más precisamente las instrucciones del usuario.

Claude Sonnet se puede probar gratis, mientras que Opus ya requiere suscripción. Ambos modelos se niegan a ejecutar tareas complejas 65% menos frecuentemente comparado con sus predecesores. Tecnológicamente, los modelos soportan pensamiento extendido – alternan análisis con el uso de herramientas de búsqueda web y ejecutan tareas en paralelo.

Opus 4 demuestra comprensión profunda de bases de código complejas, mientras que Sonnet 4 está optimizado para tareas de programación cotidianas. GitHub ya está probando la integración en su producto Copilot. Ya he probado ambos modelos y puedo decir que los nuevos modelos funcionan más precisa y rápidamente. Donde antes había varios intentos, ahora todo es mucho más rápido y preciso. ¡¡¡Estoy realmente sorprendido!!!

Claude 4 Opus es ahora mismo el mejor del mundo para codificación, según el benchmark SWE-bench y superó tanto a Gemini 2.5 Pro como a OpenAI o3.

En la presentación de los nuevos modelos, el director de Anthropic Dario Amodei también dio un pronóstico interesante de que ya el próximo año veremos la aparición de una empresa valorada en $1 mil millones con 1 empleado e inteligencia artificial.