Post Thumbnail

Google lanzó el primer modelo local Gemini Robotics On-Device

La empresa Google presentó el modelo más genial Gemini Robotics On-Device. Esta es la primera solución del mundo que combina visión por computadora, comprensión del lenguaje y acciones físicas en un paquete local unificado. ¡Que libera a los robots de la dependencia constante de la computación en la nube!

La singularidad del nuevo modelo radica en su universalidad. Funciona tanto con plataformas humanoides como con manipuladores industriales de dos manos. Impresionante es también la capacidad del sistema para realizar las operaciones más complejas con dos manos. Desde manipulaciones con objetos pequeños hasta ensamblaje de construcciones y transporte de objetos.

La eficiencia de aprendizaje también funciona excelentemente. ¡Al modelo le bastan solo 100 demostraciones para dominar nuevas acciones! Al mismo tiempo, el sistema inicialmente fue entrenado solo en el dataset ALOHA con instrucciones humanas. Pero pudo transferir conocimientos a diversas plataformas robóticas.

Google lanzó simultáneamente el SDK Gemini Robotics. Este es un conjunto de herramientas para desarrolladores que permite personalizar el modelo para tareas específicas.

El funcionamiento completamente autónomo para robots abre enormes posibilidades para aplicación en condiciones de conexión inestable. O para tareas que requieren latencia mínima de respuesta. ¡Y esto podría ser el inicio de una nueva era de robots verdaderamente independientes!

Autor: AIvengo

Latest News

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.

OpenAI prepara primer modelo abierto no más débil que O3 Mini

La empresa OpenAI se prepara para lanzar su primer modelo de lenguaje abierto. Hará honor a su nombre, por así decirlo. Este es un giro serio para la empresa que anteriormente mantenía cerrados sus poderosos desarrollos.

Grok 4 obtuvo 57% en "El Último Examen" versus 22% de Gemini 2.5 Pro

Elon Musk presentó una nueva versión de su red neuronal – Grok 4. La versión máxima – Grok 4 Heavy – puede ejecutar múltiples cálculos simultáneamente y obtiene 57% en la prueba más difícil "El Último Examen de la Humanidad". Para comparación, el líder anterior Gemini 2.5 Pro mostró solo 22%.