Atari de 1977 aplastó a ChatGPT en ajedrez después de 1.5 horas de juego
La batalla de ajedrez entre pasado y futuro terminó inesperadamente. Imaginen. Una vieja consola Atari de 1977 aplastó a la inteligencia artificial moderna ChatGPT. El programador Robert Caruso organizó esta competencia inusual, cuyos resultados sorprendieron a muchos.
ChatGPT jugó como un principiante completo. Confundía torres con alfiles, perdía piezas en el tablero y violaba reglas básicas del ajedrez. Incluso cambiar a la notación estándar de ajedrez no ayudó al modelo de lenguaje. Caruso pasó 1.5 horas constantemente impidiendo que la inteligencia artificial cometiera los errores más groseros, hasta que finalmente admitió la derrota.
¿Y qué pasa con Atari? La vieja consola simplemente hacía su trabajo – calculaba posiciones un movimiento hacia adelante. Y tomaba decisiones basadas en reglas estrictas. La razón de tal derrota radica en tecnologías fundamentalmente diferentes. Los motores de ajedrez son algoritmos altamente especializados, diseñados para una tarea específica. Usan poder computacional para analizar millones de posiciones posibles.
Los grandes modelos de lenguaje funcionan completamente diferente. ChatGPT predice el siguiente token basado en estadísticas de datos de entrenamiento, no aplicando reglas del juego. Los modelos de lenguaje olvidan movimientos anteriores e incluso inventan piezas inexistentes. Sin embargo, no encontré información sobre qué modelo exactamente de ChatGPT fue usado en esta confrontación.
Humanoide de 70 kilogramos vuela con turbinasLos ingenieros italianos lograron lo increíble. ¡El humanoide volador metálico iRonCub3 con proporciones humanas que pesa 70 kg vuela! 4 turbinas poderosas levantaron al humanoide a una altura de 50 cm, demostrando tecnología que anteriormente existía solo en la ciencia ficción.
MIT y Microsoft expusieron las mentiras de GPT-3.5Un equipo de científicos del MIT y Microsoft desarrolló una metodología que permite mirar detrás de escenas del pensamiento de modelos de lenguaje. Y entender cuándo nos mienten. La investigación revela casos preocupantes de discrepancia sistemática entre las razones reales de las decisiones de los modelos y sus explicaciones verbales.
OpenAI atrae clientes de Microsoft con descuentosLa empresa OpenAI comenzó a proporcionar descuentos significativos en suscripciones corporativas de ChatGPT — ¡del 10 al 20%! Pero los descuentos están disponibles con inversiones adicionales en otros productos de OpenAI, incluyendo Deep Research, Codex y gastos aumentados de API. Y este paso sin precedentes causa seria preocupación en Microsoft.
GigaChat perdió contra Claude y Gemini en idioma ruso en el benchmark MERALas pruebas de GigaChat revelan la dura verdad sobre el lugar de Rusia en la carrera global de inteligencia artificial. Pruebas recientes en el benchmark MERA mostraron resultados que obligan a una reflexión seria. El modelo ruso, creado específicamente para trabajar con el idioma ruso, perdió inesperadamente contra competidores extranjeros en su propio "elemento nativo".