Post Thumbnail

Google lanzó el primer modelo local Gemini Robotics On-Device

La empresa Google presentó el modelo más genial Gemini Robotics On-Device. Esta es la primera solución del mundo que combina visión por computadora, comprensión del lenguaje y acciones físicas en un paquete local unificado. ¡Que libera a los robots de la dependencia constante de la computación en la nube!

La singularidad del nuevo modelo radica en su universalidad. Funciona tanto con plataformas humanoides como con manipuladores industriales de dos manos. Impresionante es también la capacidad del sistema para realizar las operaciones más complejas con dos manos. Desde manipulaciones con objetos pequeños hasta ensamblaje de construcciones y transporte de objetos.

La eficiencia de aprendizaje también funciona excelentemente. ¡Al modelo le bastan solo 100 demostraciones para dominar nuevas acciones! Al mismo tiempo, el sistema inicialmente fue entrenado solo en el dataset ALOHA con instrucciones humanas. Pero pudo transferir conocimientos a diversas plataformas robóticas.

Google lanzó simultáneamente el SDK Gemini Robotics. Este es un conjunto de herramientas para desarrolladores que permite personalizar el modelo para tareas específicas.

El funcionamiento completamente autónomo para robots abre enormes posibilidades para aplicación en condiciones de conexión inestable. O para tareas que requieren latencia mínima de respuesta. ¡Y esto podría ser el inicio de una nueva era de robots verdaderamente independientes!

Autor: AIvengo

Latest News

Estafador de IA se hizo pasar por Keanu Reeves durante 2.5 años y robó $160,000

Dianne Ringstaff se convirtió en víctima de una estafa sofisticada cuando estaba jugando un juego móvil y recibió un mensaje seguido de una videollamada. Las tecnologías de inteligencia artificial eran tan avanzadas que la mujer estaba absolutamente segura — el verdadero Keanu Reeves la estaba llamando.

Humanoide de 70 kilogramos vuela con turbinas

Los ingenieros italianos lograron lo increíble. ¡El humanoide volador metálico iRonCub3 con proporciones humanas que pesa 70 kg vuela! 4 turbinas poderosas levantaron al humanoide a una altura de 50 cm, demostrando tecnología que anteriormente existía solo en la ciencia ficción.

MIT y Microsoft expusieron las mentiras de GPT-3.5

Un equipo de científicos del MIT y Microsoft desarrolló una metodología que permite mirar detrás de escenas del pensamiento de modelos de lenguaje. Y entender cuándo nos mienten. La investigación revela casos preocupantes de discrepancia sistemática entre las razones reales de las decisiones de los modelos y sus explicaciones verbales.

OpenAI atrae clientes de Microsoft con descuentos

La empresa OpenAI comenzó a proporcionar descuentos significativos en suscripciones corporativas de ChatGPT — ¡del 10 al 20%! Pero los descuentos están disponibles con inversiones adicionales en otros productos de OpenAI, incluyendo Deep Research, Codex y gastos aumentados de API. Y este paso sin precedentes causa seria preocupación en Microsoft.

GigaChat perdió contra Claude y Gemini en idioma ruso en el benchmark MERA

Las pruebas de GigaChat revelan la dura verdad sobre el lugar de Rusia en la carrera global de inteligencia artificial. Pruebas recientes en el benchmark MERA mostraron resultados que obligan a una reflexión seria. El modelo ruso, creado específicamente para trabajar con el idioma ruso, perdió inesperadamente contra competidores extranjeros en su propio "elemento nativo".