Post Thumbnail

Claude 4 Opus reconocido como el mejor del mundo para codificación, superando a Gemini y OpenAI o3

Anthropic presentó la 4ta generación de la inteligencia artificial Claude. ¡Estoy gratamente impactado! La nueva línea incluye 2 modelos – Opus 4 y Sonnet 4. Ambos modelos demuestran un nivel fundamentalmente nuevo de trabajo con programación y tareas de agentes.

Claude Opus 4 se posiciona como el mejor modelo del mundo para trabajar con código. La característica principal es la capacidad de mantener rendimiento estable al ejecutar tareas complejas a largo plazo. El modelo puede trabajar continuamente en una tarea durante horas, manteniendo el enfoque en el contexto original.

Claude Sonnet 4 representa una actualización significativa de la versión anterior 3.7. El modelo muestra capacidades mejoradas en programación y pensamiento lógico, mientras sigue más precisamente las instrucciones del usuario.

Claude Sonnet se puede probar gratis, mientras que Opus ya requiere suscripción. Ambos modelos se niegan a ejecutar tareas complejas 65% menos frecuentemente comparado con sus predecesores. Tecnológicamente, los modelos soportan pensamiento extendido – alternan análisis con el uso de herramientas de búsqueda web y ejecutan tareas en paralelo.

Opus 4 demuestra comprensión profunda de bases de código complejas, mientras que Sonnet 4 está optimizado para tareas de programación cotidianas. GitHub ya está probando la integración en su producto Copilot. Ya he probado ambos modelos y puedo decir que los nuevos modelos funcionan más precisa y rápidamente. Donde antes había varios intentos, ahora todo es mucho más rápido y preciso. ¡¡¡Estoy realmente sorprendido!!!

Claude 4 Opus es ahora mismo el mejor del mundo para codificación, según el benchmark SWE-bench y superó tanto a Gemini 2.5 Pro como a OpenAI o3.

En la presentación de los nuevos modelos, el director de Anthropic Dario Amodei también dio un pronóstico interesante de que ya el próximo año veremos la aparición de una empresa valorada en $1 mil millones con 1 empleado e inteligencia artificial.

Autor: AIvengo
Latest News
OpenAI promete crear científico de IA completo para 2028

OpenAI prometió crear científico basado en IA completo para 2028. CEO de compañía Sam Altman también declaró que sistemas de aprendizaje profundo podrán realizar funciones de científicos investigadores a nivel de pasante para septiembre de próximo año. Y nivel de investigador de IA autónomo completo podría alcanzarse para 2028.

Empleos para jóvenes especialistas IT en Gran Bretaña colapsaron 46%

¿Saben qué está pasando en mercado laboral para jóvenes especialistas IT en Gran Bretaña? Durante último año, número de empleos para jóvenes especialistas colapsó 46%. Y se pronostica caída adicional de 53%, reporta The Register. Citando estadísticas de Institute of Student Employers.

Pavel Durov presentó Cocoon - red descentralizada para lanzar IA

Jefe de Telegram Pavel Durov habló en conferencia Blockchain Life en Dubái y presentó allí su nuevo proyecto llamado Cocoon. Y este es intento de desafiar monopolio de grandes corporaciones sobre IA.

Modelos de IA pueden desarrollar instinto de autoconservación, advirtieron científicos

Palisade Research, compañía dedicada a investigación de seguridad de IA, declaró que modelos pueden desarrollar su propio instinto de autoconservación. Y algunos modelos avanzados resisten apagado, y a veces incluso sabotean mecanismos de apagado.

IA pasó prueba de Turing en música

Universidad de Minas Gerais en Brasil realizó experimento. Participantes recibieron pares de canciones, en cada una de las cuales había pista generada. Necesitaban determinar cuál exactamente. Y resultados fueron inesperados.