Post Thumbnail

OpenAI представил ИИ-агента Operator

OpenAI представила Operator – агента на базе GPT-4 o, способного выполнять онлайн-задачи в браузере. Агент работает через специальный интерфейс. Где пользователь видит окно браузера и может контролировать действия ассистента.

Operator использует Computer-Using Agent, комбинирующий визуальные возможности GPT-4 o с продвинутым мышлением. Через обучение с подкреплением. Computer-Using Agent достиг 38,1% успеха на тесте OSWorld. И 87% на WebVoyager, превзойдя предыдущие модели.

Агент работает на удаленном сервере через зашифрованное соединение. Пользователь может перехватывать управление для ввода капчи или платежных данных. У Operator есть набор инструкций для хранения пользовательских предпочтений. Вы можете ввести любой запрос и даже с фото. И ассистент начнет поиск в браузере — можно поручить заказ еды, бронь столика, покупку билетов, вызов такси и многое другое. Также Operator показывает мини-экран со всем, что он делает в реальном времени.

OpenAI делает большой упор на безопасность системы и устойчивость к атакам. Весь процесс мониторится отдельной моделью, которая может вызвать остановку выполнения, если что-то не так. Кроме этого, некоторые подозрительные ситуации будут отправляться на ручную проверку.

Сервис доступен Pro-пользователям в США, через несколько недель будет добавлен в Plus-подписку. И API для разработчиков. Хотя Anthropic и Google показывали похожие демонстрации раньше, OpenAI первой запустила потребительский продукт, несмотря на убыточность Pro-подписки. Остается надеяться, что когда Operator научится делать покупки самостоятельно, он не начнет заказывать подарки себе на день активации.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Как создать бесконечную вселенную одним текстовым промптом

Забудьте всё, что вы знали о создании игровых миров. Tencent только что выложила в open-source модель Hunyuan-GameCraft. Которая генерирует интерактивные виртуальные миры прямо на вашей видеокарте. Ссылка в описании. 1 текстовый промпт — и у вас бесконечная вселенная.

Как синхронизация 3 источников света защищает от подделок

Искусственный интеллект научился создавать видео подделки, которые невозможно отличить от реальности. И это огромная проблема и вопрос доверия в обществе. Но учёные из Корнелльского университета нашли гениальное решение. Они спрятали водяные знаки прямо в обычном освещении.

Хип-хоп, ушу и пекинская опера на церемонии открытия роботиады

В Китае прошли 1 Всемирные Игры Гуманоидных роботов на которых выступили 280 команд из 16 стран. Которые привезли более 500 андроидов. Получилась почти настоящая олимпиада для роботов со всеми атрибутами большого спорта.

Первая система LAARMA защищает животных на австралийских дорогах

В Австралии столкновения животных с автомобилями являются серьёзной проблемой для экосистемы этого континента. Теперь учёные нашли технологическое решение. 1 в мире придорожную систему LAARMA на базе искусственного интеллекта, которая защищает диких животных от опасных встреч с транспортом.

Nvidia представила семейство моделей Cosmos для робототехники

Компания Nvidia представила семейство моделей искусственного интеллекта Cosmos. Которые могут фундаментально изменить подход к созданию роботов и физических искусственный интеллект-агентов.