Post Thumbnail

Google lanzó el primer modelo local Gemini Robotics On-Device

La empresa Google presentó el modelo más genial Gemini Robotics On-Device. Esta es la primera solución del mundo que combina visión por computadora, comprensión del lenguaje y acciones físicas en un paquete local unificado. ¡Que libera a los robots de la dependencia constante de la computación en la nube!

La singularidad del nuevo modelo radica en su universalidad. Funciona tanto con plataformas humanoides como con manipuladores industriales de dos manos. Impresionante es también la capacidad del sistema para realizar las operaciones más complejas con dos manos. Desde manipulaciones con objetos pequeños hasta ensamblaje de construcciones y transporte de objetos.

La eficiencia de aprendizaje también funciona excelentemente. ¡Al modelo le bastan solo 100 demostraciones para dominar nuevas acciones! Al mismo tiempo, el sistema inicialmente fue entrenado solo en el dataset ALOHA con instrucciones humanas. Pero pudo transferir conocimientos a diversas plataformas robóticas.

Google lanzó simultáneamente el SDK Gemini Robotics. Este es un conjunto de herramientas para desarrolladores que permite personalizar el modelo para tareas específicas.

El funcionamiento completamente autónomo para robots abre enormes posibilidades para aplicación en condiciones de conexión inestable. O para tareas que requieren latencia mínima de respuesta. ¡Y esto podría ser el inicio de una nueva era de robots verdaderamente independientes!

Autor: AIvengo

Latest News

Cómo Robomart reduce costos de entrega 70% a través de robótica

$3 por cualquier entrega. Robomart desafía a gigantes DoorDash y Uber Eats con modelo de negocio nuevo para la industria. Su nuevo robot RM5 cambia completamente la economía de entregas.

Colaboración inusual entre competidores en pruebas de seguridad de IA

Dos principales competidores en el mundo de la inteligencia artificial se unieron por primera vez para pruebas conjuntas de seguridad. OpenAI y Anthropic se abrieron acceso mutuo a sus modelos secretos. En una industria donde las empresas pagan a investigadores hasta $100 millones y luchan por cada usuario, tal colaboración parece increíble.

Por qué Gemini alcanzó 50% de la audiencia móvil de ChatGPT

Google Gemini ya tiene la mitad de la audiencia de ChatGPT en dispositivos móviles. Estos son datos del nuevo reporte del fondo de capital de riesgo Andreessen Horowitz sobre el mercado de IA de consumo. 2.5 años de investigación muestran un panorama interesante.

Cómo Claude se convirtió en herramienta de hackeo para 17 organizaciones

La empresa Anthropic publicó un reporte analítico de seguridad. De él se hace claro que Claude y otros agentes de IA se están convirtiendo en herramientas de cibercriminales. En Anthropic llamaron a esta nueva dirección vibe-hacking. Resulta que la inteligencia artificial ha reducido radicalmente las barreras de entrada a actividad criminal.

Cómo xAI compite con OpenAI en herramientas para desarrolladores

xAI lanza Grok Code Fast 1. Este es un modelo agéntico compacto para programación. $0.20 por 1 millón de tokens de entrada, $1.50 por salida — ¡y solo $0.02 usando caché!