Google выпустил первую локальную модель Gemini Robotics On-Device
Компания Google представила крутейшую модель Gemini Robotics On-Device. Это 1 в мире решение, объединяющее компьютерное зрение, языковое понимание и физические действия в едином локальном пакете. Которое освобождает роботов от постоянной зависимости от облачных вычислений!
Уникальность новой модели заключается в её универсальности. Она работает как с гуманоидными платформами, так и с промышленными 2-рукими манипуляторами. Впечатляет и способность системы выполнять сложнейшие 2-ручные операции. От манипуляций с мелкими предметами до сборки конструкций и переноса объектов.
Отлично работает и эффективность обучения. Модели достаточно всего 100 демонстраций для освоения новых действий! При этом изначально система тренировалась только на датасете ALOHA с человеческими инструкциями. Но смогла перенести знания на разнообразные робототехнические платформы.
Google одновременно выпустила SDK Gemini Robotics. Это набор инструментов для разработчиков, позволяющий кастомизировать модель под специфические задачи.
Полностью автономная работа для роботов открывает огромные возможности для применения в условиях нестабильной связи. Или при задачах, требующих минимальной задержки отклика. И это может быть стартом новой эры по-настоящему самостоятельных роботов!
Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Meta инвестирует сотни млрд в суперкластеры с энергопотреблением 5 ГВтМарк Цукерберг объявил о беспрецедентных инвестициях в инфраструктуру искусственного интеллекта нового поколения! Компания вложит сотни млрд долларов в создание суперкластеров серверов. Которые будут потреблять от 1 до 5 ГВт каждый. Это энергопотребление на уровне целой атомной электростанции!
Рай для интровертов: ИИ будет разговаривать с сотрудниками компанийGoogle выпустила новую функцию и теперь искусственный интеллект может звонить в местные компании от вашего имени. Чтобы узнать информацию о ценах и доступности услуг. Вам больше не нужно самим поднимать трубку и разговаривать с сотрудниками. Именно так выглядит рай интроверта.
OpenAI объединила ChatGPT, Deep Research и Operator в одном агентеКомпания OpenAI представила ChatGPT Agent. Мощное объединение ChatGPT, Deep Research и Operator в едином решении. Принцип работы максимально прост. Вы ставите цель, например, отправить письма, создать таблицы, купить билеты или забронировать отели. ChatGPT Agent самостоятельно разбивает эту цель на отдельные задачи, переходит по нужным сайтам, ищет информацию и заполняет формы. Перед критически важными действиями, такими как оплата, публикация или отправка, агент обязательно запрашивает ваше подтверждение.
Только 1 программист в мире смог обыграть ИИ от OpenAIПредставьте себе мир, где искусственный интеллект соревнуется с лучшими программистами планеты. Такое противостояние произошло на престижном турнире AtCoder World Tour Finals. Это 1 из самых элитных соревнований в мире программирования, куда попасть крайне сложно.