OpenAGI выпустил модель Lux, которая обгоняет Google и OpenAI

Стартап OpenAGI выпустил модель Lux для управления компьютером и заявляет, что это прорыв. По бенчмаркам модель на целое поколение обгоняет аналоги от Google, OpenAI и Anthropic. Кроме того, она работает быстрее. Примерно 1 секунда на шаг вместо 3 секунд у конкурентов. И в 10 раз дешевле по стоимости обработки 1 токена.

Как вам название проекта? OpenAI будет рад OpenAGI особенно!

Основатели из MIT утверждают, что суть успеха в том, что это не затюненная большая языковая модель. А система, которую с самого начала учили именно совершать действия. То есть абсолютно другая парадигма. Они открыли код инфраструктуры, в которой обучали агента, так что можно покопаться.

OpenAGI позиционирует себя как открытая исследовательская лаборатория, созданная исследователями из MIT, UIUC и CMU. Они строят агентные модели, переосмысливая предтренировку, пост-тренировку и масштабное обучение с подкреплением. Их цель — довести компьютеры до 4 эры: компьютер, который думает и действует за вас.

И вот здесь возникает интересный вопрос. Крупные корпорации пытаются натянуть языковые модели на задачи управления компьютером. А небольшая команда из MIT идёт с другого конца. Строит систему, заточенную под действия с самого начала. Получается, что старый подход, где большие языковые модели плюс дополнительная настройка может быть тупиком.

Если OpenAGI правы, то мы наблюдаем смену парадигмы прямо сейчас. Не улучшение существующих моделей, а фундаментально иной подход к созданию агентов.