Post Thumbnail

Google y Cambridge enseñaron a IA a pensar con imágenes en lugar de texto

Científicos de Google y Cambridge presentaron un enfoque fundamentalmente nuevo al trabajo de inteligencia artificial, llamado “Visual Planning”. La característica de esta tecnología es que el modelo piensa no con texto, sino con imágenes. Lo que está mucho más cerca del pensamiento natural humano, especialmente al resolver tareas espaciales y matemáticas.

Los investigadores publicaron un artículo titulado “Visual Planning: Let’s Think Only with Images”, donde describieron el proceso de entrenar un modelo para navegar laberintos usando solo pensamiento visual, sin razonamiento textual. Este enfoque imita la capacidad de las personas de pensar con esquemas e imágenes al resolver tareas complejas. Enlace en la descripción.

El entrenamiento del modelo procedió en dos etapas. Primero, se le mostraron muchas imágenes de laberintos y se le enseñó a predecir cualquier posible siguiente paso. Por ejemplo, si en la imagen un agente está ubicado en celda B, el modelo debería generar nueva imagen donde el agente se mueve a una de las celdas vecinas disponibles.

En la segunda etapa los investigadores aplicaron aprendizaje por refuerzo. El modelo recibía recompensa positiva por paso correcto, cero — por incorrecto, y negativa — por acción inadmisible. Así, gradualmente aprendió a elegir caminos óptimos a través del laberinto. Apoyándose solo en imágenes visuales.

¡Los resultados superaron expectativas! Visual Planning supera incluso a modelo tan avanzado como Gemini 2.5 Pro think en una vez y media a dos veces en eficiencia de resolver tareas que requieren pensamiento espacial. ¡Estoy en shock agradable!

Autor: AIvengo
Latest News
Dario Amodei se justifica públicamente y demuestra lealtad a Trump

Díganme, cuando jefe de compañía comienza a justificarse públicamente y explicar su posición política, ¿qué dice eso? Correcto - fue acorralado. Fundador de Anthropic Dario Amodei publicó declaración sobre compromiso con liderazgo estadounidense en IA. Y saben, se lee como verdadero discurso de defensa.

Mitad de jóvenes estadounidenses consulta IA sobre temas de salud

Casi mitad de jóvenes estadounidenses de 16 a 34 años consulta regularmente inteligencia artificial sobre temas de salud. Sociólogos descubrieron que bots ganan popularidad como alternativa a médicos reales. Debido a dificultades con citas en clínicas, actitud insuficientemente seria de médicos hacia síntomas y diagnósticos erróneos. Más de tercio de participantes de estudio se quejan de todo esto.

Padrinos de IA Bengio y Hinton llaman a detener desarrollo de AGI

850 personas, incluyendo cofundador de Apple Steve Wozniak y fundador de Virgin Group Richard Branson, firmaron declaración llamando a prohibir desarrollo de superinteligencia o AGI. Esta es forma hipotética de inteligencia artificial que superará a humanos en prácticamente todas tareas cognitivas.

Jefe de Nvidia predice personal de especialistas virtuales para compañías

Jefe de Nvidia Jensen Huang dijo aquí que en futuro personas vivas trabajarán lado a lado con "personas digitales". Así llama a agentes de IA. Suena lindo, ¿verdad? Especialmente cuando entienden que esta persona dirige una de compañías en epicentro de boom tecnológico y tiene interés vital en que todos crean esto.

USA presentó primer policía robot basado en Ford Explorer

USA presentó primer policía de patrulla robot, ¿y saben qué? Parece auto normal, solo empacado con IA hasta tope. Este vehículo de patrulla no tripulado se llama Police Unmanned Ground Vehicle, o simplemente PUG.