Post Thumbnail

Google y Cambridge enseñaron a IA a pensar con imágenes en lugar de texto

Científicos de Google y Cambridge presentaron un enfoque fundamentalmente nuevo al trabajo de inteligencia artificial, llamado «Visual Planning». La característica de esta tecnología es que el modelo piensa no con texto, sino con imágenes. Lo que está mucho más cerca del pensamiento natural humano, especialmente al resolver tareas espaciales y matemáticas.

Los investigadores publicaron un artículo titulado «Visual Planning: Let’s Think Only with Images», donde describieron el proceso de entrenar un modelo para navegar laberintos usando solo pensamiento visual, sin razonamiento textual. Este enfoque imita la capacidad de las personas de pensar con esquemas e imágenes al resolver tareas complejas. Enlace en la descripción.

El entrenamiento del modelo procedió en dos etapas. Primero, se le mostraron muchas imágenes de laberintos y se le enseñó a predecir cualquier posible siguiente paso. Por ejemplo, si en la imagen un agente está ubicado en celda B, el modelo debería generar nueva imagen donde el agente se mueve a una de las celdas vecinas disponibles.

En la segunda etapa los investigadores aplicaron aprendizaje por refuerzo. El modelo recibía recompensa positiva por paso correcto, cero — por incorrecto, y negativa — por acción inadmisible. Así, gradualmente aprendió a elegir caminos óptimos a través del laberinto. Apoyándose solo en imágenes visuales.

¡Los resultados superaron expectativas! Visual Planning supera incluso a modelo tan avanzado como Gemini 2.5 Pro think en una vez y media a dos veces en eficiencia de resolver tareas que requieren pensamiento espacial. ¡Estoy en shock agradable!

Autor: AIvengo

Latest News

NVIDIA no podía vender chips de IA hasta que apareció OpenAI

Jefe de NVIDIA Jensen Huang compartió historia interesante que hoy parece momento fatídico en desarrollo de tecnologías modernas.

Pudu Robotics lanzó CC1 Pro — robot limpia 8000 m² por ciclo

Compañía Pudu Robotics presentó nueva generación de sistemas de limpieza autónomos — CC1 Pro. Que eleva estándares de limpieza en grandes objetos comerciales a nivel fundamentalmente nuevo.

Boston Dynamics lanzó Orbit 5.0 — IA redujo inspecciones en 70%

Salió actualización genial Orbit 5.0 para plataforma de control de robots Spot de Boston Dynamics. ¡Que cambia fundamentalmente enfoque hacia analítica industrial y monitoreo! Sistema ahora permite control centralizado de flotas enteras de robots en múltiples instalaciones, proporcionando a operadores analítica detallada en tiempo real.

Abu Dhabi gastará $2.5 mil millones en ciudad gestionada por IA para 2027

Imaginen ciudad donde inteligencia artificial cuida cada aspecto de su vida. ¡Esto no es ciencia ficción, sino futuro cercano de Abu Dhabi! Compañías BOLD Technologies y My Aion están desarrollando plataforma unificada Aion Sentia. Que tomará control de todos sistemas urbanos — desde transporte hasta salud y educación.

4 ingenieros chinos contrabanderon 80 TB de datos de IA en mochilas a Malasia

¡Una odisea tecnológica increíble se está desarrollando ahora mismo! Ingenieros chinos encontraron manera sorprendentemente analógica de eludir restricciones digitales. Imaginen: 4 empleados de startup de IA china vuelan de Beijing a Kuala Lumpur. ¡Y cada uno lleva 15 discos duros en su mochila! En total — 80 terabytes de datos para entrenamiento de redes neuronales.