Post Thumbnail

Atari de 1977 aplastó a ChatGPT en ajedrez después de 1.5 horas de juego

La batalla de ajedrez entre pasado y futuro terminó inesperadamente. Imaginen. Una vieja consola Atari de 1977 aplastó a la inteligencia artificial moderna ChatGPT. El programador Robert Caruso organizó esta competencia inusual, cuyos resultados sorprendieron a muchos.

ChatGPT jugó como un principiante completo. Confundía torres con alfiles, perdía piezas en el tablero y violaba reglas básicas del ajedrez. Incluso cambiar a la notación estándar de ajedrez no ayudó al modelo de lenguaje. Caruso pasó 1.5 horas constantemente impidiendo que la inteligencia artificial cometiera los errores más groseros, hasta que finalmente admitió la derrota.

¿Y qué pasa con Atari? La vieja consola simplemente hacía su trabajo – calculaba posiciones un movimiento hacia adelante. Y tomaba decisiones basadas en reglas estrictas. La razón de tal derrota radica en tecnologías fundamentalmente diferentes. Los motores de ajedrez son algoritmos altamente especializados, diseñados para una tarea específica. Usan poder computacional para analizar millones de posiciones posibles.

Los grandes modelos de lenguaje funcionan completamente diferente. ChatGPT predice el siguiente token basado en estadísticas de datos de entrenamiento, no aplicando reglas del juego. Los modelos de lenguaje olvidan movimientos anteriores e incluso inventan piezas inexistentes. Sin embargo, no encontré información sobre qué modelo exactamente de ChatGPT fue usado en esta confrontación.

Autor: AIvengo

Latest News

Cómo Robomart reduce costos de entrega 70% a través de robótica

$3 por cualquier entrega. Robomart desafía a gigantes DoorDash y Uber Eats con modelo de negocio nuevo para la industria. Su nuevo robot RM5 cambia completamente la economía de entregas.

Colaboración inusual entre competidores en pruebas de seguridad de IA

Dos principales competidores en el mundo de la inteligencia artificial se unieron por primera vez para pruebas conjuntas de seguridad. OpenAI y Anthropic se abrieron acceso mutuo a sus modelos secretos. En una industria donde las empresas pagan a investigadores hasta $100 millones y luchan por cada usuario, tal colaboración parece increíble.

Por qué Gemini alcanzó 50% de la audiencia móvil de ChatGPT

Google Gemini ya tiene la mitad de la audiencia de ChatGPT en dispositivos móviles. Estos son datos del nuevo reporte del fondo de capital de riesgo Andreessen Horowitz sobre el mercado de IA de consumo. 2.5 años de investigación muestran un panorama interesante.

Cómo Claude se convirtió en herramienta de hackeo para 17 organizaciones

La empresa Anthropic publicó un reporte analítico de seguridad. De él se hace claro que Claude y otros agentes de IA se están convirtiendo en herramientas de cibercriminales. En Anthropic llamaron a esta nueva dirección vibe-hacking. Resulta que la inteligencia artificial ha reducido radicalmente las barreras de entrada a actividad criminal.

Cómo xAI compite con OpenAI en herramientas para desarrolladores

xAI lanza Grok Code Fast 1. Este es un modelo agéntico compacto para programación. $0.20 por 1 millón de tokens de entrada, $1.50 por salida — ¡y solo $0.02 usando caché!