Post Thumbnail

Google выпустил первую локальную модель Gemini Robotics On-Device

Компания Google представила крутейшую модель Gemini Robotics On-Device. Это 1 в мире решение, объединяющее компьютерное зрение, языковое понимание и физические действия в едином локальном пакете. Которое освобождает роботов от постоянной зависимости от облачных вычислений!

Уникальность новой модели заключается в её универсальности. Она работает как с гуманоидными платформами, так и с промышленными 2-рукими манипуляторами. Впечатляет и способность системы выполнять сложнейшие 2-ручные операции. От манипуляций с мелкими предметами до сборки конструкций и переноса объектов.

Отлично работает и эффективность обучения. Модели достаточно всего 100 демонстраций для освоения новых действий! При этом изначально система тренировалась только на датасете ALOHA с человеческими инструкциями. Но смогла перенести знания на разнообразные робототехнические платформы.

Google одновременно выпустила SDK Gemini Robotics. Это набор инструментов для разработчиков, позволяющий кастомизировать модель под специфические задачи.

Полностью автономная работа для роботов открывает огромные возможности для применения в условиях нестабильной связи. Или при задачах, требующих минимальной задержки отклика. И это может быть стартом новой эры по-настоящему самостоятельных роботов!

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Исследователи OpenAI и Anthropic раскритиковали безопасность xAI

Исследователи из OpenAI, Anthropic и других организаций публично раскритиковали культуру безопасности в компании xAI, принадлежащей Илону Маску. Назвав её "безрассудной" и "совершенно безответственной".

Meta инвестирует сотни млрд в суперкластеры с энергопотреблением 5 ГВт

Марк Цукерберг объявил о беспрецедентных инвестициях в инфраструктуру искусственного интеллекта нового поколения! Компания вложит сотни млрд долларов в создание суперкластеров серверов. Которые будут потреблять от 1 до 5 ГВт каждый. Это энергопотребление на уровне целой атомной электростанции!

Рай для интровертов: ИИ будет разговаривать с сотрудниками компаний

Google выпустила новую функцию и теперь искусственный интеллект может звонить в местные компании от вашего имени. Чтобы узнать информацию о ценах и доступности услуг. Вам больше не нужно самим поднимать трубку и разговаривать с сотрудниками. Именно так выглядит рай интроверта.

OpenAI объединила ChatGPT, Deep Research и Operator в одном агенте

Компания OpenAI представила ChatGPT Agent. Мощное объединение ChatGPT, Deep Research и Operator в едином решении. Принцип работы максимально прост. Вы ставите цель, например, отправить письма, создать таблицы, купить билеты или забронировать отели. ChatGPT Agent самостоятельно разбивает эту цель на отдельные задачи, переходит по нужным сайтам, ищет информацию и заполняет формы. Перед критически важными действиями, такими как оплата, публикация или отправка, агент обязательно запрашивает ваше подтверждение.

Только 1 программист в мире смог обыграть ИИ от OpenAI

Представьте себе мир, где искусственный интеллект соревнуется с лучшими программистами планеты. Такое противостояние произошло на престижном турнире AtCoder World Tour Finals. Это 1 из самых элитных соревнований в мире программирования, куда попасть крайне сложно.