Post Thumbnail

Claude 4 Opus reconocido como el mejor del mundo para codificación, superando a Gemini y OpenAI o3

Anthropic presentó la 4ta generación de la inteligencia artificial Claude. ¡Estoy gratamente impactado! La nueva línea incluye 2 modelos – Opus 4 y Sonnet 4. Ambos modelos demuestran un nivel fundamentalmente nuevo de trabajo con programación y tareas de agentes.

Claude Opus 4 se posiciona como el mejor modelo del mundo para trabajar con código. La característica principal es la capacidad de mantener rendimiento estable al ejecutar tareas complejas a largo plazo. El modelo puede trabajar continuamente en una tarea durante horas, manteniendo el enfoque en el contexto original.

Claude Sonnet 4 representa una actualización significativa de la versión anterior 3.7. El modelo muestra capacidades mejoradas en programación y pensamiento lógico, mientras sigue más precisamente las instrucciones del usuario.

Claude Sonnet se puede probar gratis, mientras que Opus ya requiere suscripción. Ambos modelos se niegan a ejecutar tareas complejas 65% menos frecuentemente comparado con sus predecesores. Tecnológicamente, los modelos soportan pensamiento extendido – alternan análisis con el uso de herramientas de búsqueda web y ejecutan tareas en paralelo.

Opus 4 demuestra comprensión profunda de bases de código complejas, mientras que Sonnet 4 está optimizado para tareas de programación cotidianas. GitHub ya está probando la integración en su producto Copilot. Ya he probado ambos modelos y puedo decir que los nuevos modelos funcionan más precisa y rápidamente. Donde antes había varios intentos, ahora todo es mucho más rápido y preciso. ¡¡¡Estoy realmente sorprendido!!!

Claude 4 Opus es ahora mismo el mejor del mundo para codificación, según el benchmark SWE-bench y superó tanto a Gemini 2.5 Pro como a OpenAI o3.

En la presentación de los nuevos modelos, el director de Anthropic Dario Amodei también dio un pronóstico interesante de que ya el próximo año veremos la aparición de una empresa valorada en $1 mil millones con 1 empleado e inteligencia artificial.

Autor: AIvengo

Latest News

Nvidia presentó la familia de modelos Cosmos para robótica

La empresa Nvidia presentó la familia Cosmos de modelos de IA. Que pueden cambiar fundamentalmente el enfoque para crear robots y agentes de IA físicos.

ChatGPT llama a los usuarios "semillas estelares" del planeta Lyra

Resulta que ChatGPT puede atraer a los usuarios al mundo de teorías científicamente infundadas y místicas.

La música IA desencadena emociones más fuertes que la música humana

¿Alguna vez se han preguntado por qué una melodía les da escalofríos mientras otra los deja indiferentes? Los científicos descubrieron algo interesante. La música creada por inteligencia artificial desencadena en las personas reacciones emocionales más intensas que las composiciones escritas por humanos.

GPT-5 fue hackeado en 24 horas

2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

Cloudflare bloqueó a Perplexity por 6 millones de solicitudes ocultas al día

Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!