Post Thumbnail

Gemini Robotics: новый подход к управлению роботами через ИИ

Google представила систему Gemini Robotics, которая выводит агентов искусственного интеллекта в физический мир. Компания разработала усовершенствованную агентную систему для управления роботами. Способную лучше рассуждать и планировать, взаимодействовать с человеком и использовать инструменты типа веб-поиска.

Внутри системы одновременно работают 2 модели. Gemini Robotics-ER 1.5 и Gemini Robotics 1.5 выполняют разные функции в управлении роботами. Первая модель служит высокоуровневым мозгом, анализирует окружающую среду и действия или команды людей, составляет подробный план выполнения задачи и при необходимости вызывает инструменты.

Gemini Robotics 1.5 выступает исполнителем, который преобразует инструкции в точные двигательные команды для робота. Например, при запросе правильно рассортировать мусор исходя из местоположения пользователя система работает поэтапно.

Gemini Robotics-ER 1.5 анализирует запрос, обращается в интернет для понимания правил сортировки мусора в конкретной стране. Оценивает имеющийся мусор и отдаёт команды типа бутылку в левую кучку, салфетку в правую. Модель выдаёт трейс своего рассуждения, делая систему более интерпретируемой.

Gemini Robotics 1.5 принимает команды от ER и преобразует их в точные траектории движения. Если в процессе в окружающей среде что-то меняется, ER замечает это и корректирует инструкции. При изменении формы робота адаптировать всю систему не нужно, достаточно настроить вторую модель.

Gemini Robotics 1.5 представляет собой модель зрение-язык-действие, превращающую визуальную информацию и инструкции в команды для робота, размышляя перед действием и объясняя свой процесс. Gemini Robotics-ER 1.5 отвечает за планирование и логические решения, умеет вызывать цифровые инструменты и создавать пошаговые планы.

Модели позволяют роботам выполнять сложные многошаговые задачи, учиться на разных типах устройств и действовать более прозрачно и безопасно.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Воркслоп - эпидемия или как ИИ убивает доверие к вам

Вы наверняка сталкивались с этим. Письмо от коллеги, которое выглядит идеально: правильная структура, красивые слова, профессиональный тон. Вы начинаете читать — и понимаете, что за всей этой упаковкой нет абсолютно ничего. Никакой конкретики, никаких решений, просто красиво оформленная пустота. Поздравляю: вы только что столкнулись с воркслопом.

ИИ не умнее людей: простой тест всё покажет

Искусственный интеллект умнее большинства людей. Вот такая мысль приходит в голову почти каждому, кто регулярно пользуется современными языковыми моделями. И знаете что? Эта мысль основана на нашей ошибке восприятия.

Обзор OpenAI DevDay 2025: разбор все анонсов

OpenAI DevDay двадцать пятого года — важное событие в мире искусственного интеллекта. И это не просто очередная презентация. Я собрал для вас все важные факты, функции, мнения и вы узнаете все самое интересное, что рассказывал глава OpenAI Сэм Альтман.  

Google DeepMind исследует формирование параллельной экономики ИИ

Интересный концепт экономики искусственного интеллекта представлен в новом исследовании Google DeepMind. Ссылка в описании. Учёные проанализировали стремительно формирующуюся реальность. В которой ИИ-агенты превращаются в самостоятельных экономических игроков, способных торговать, вести переговоры и создавать ценность без прямого участия человека. И если этот процесс останется без надлежащего контроля, автономные системы могут сформировать собственную параллельную экономику, тесно связанную с человеческой. Что несёт как огромные возможности, так и серьёзные риски.