OpenAGI выпустил модель Lux, которая обгоняет Google и OpenAI

Post Thumbnail

Стартап OpenAGI выпустил модель Lux для управления компьютером и заявляет, что это прорыв. По бенчмаркам модель на целое поколение обгоняет аналоги от Google, OpenAI и Anthropic. Кроме того, она работает быстрее. Примерно 1 секунда на шаг вместо 3 секунд у конкурентов. И в 10 раз дешевле по стоимости обработки 1 токена.

Как вам название проекта? OpenAI будет рад OpenAGI особенно!

Основатели из MIT утверждают, что суть успеха в том, что это не затюненная большая языковая модель. А система, которую с самого начала учили именно совершать действия. То есть абсолютно другая парадигма. Они открыли код инфраструктуры, в которой обучали агента, так что можно покопаться.

OpenAGI позиционирует себя как открытая исследовательская лаборатория, созданная исследователями из MIT, UIUC и CMU. Они строят агентные модели, переосмысливая предтренировку, пост-тренировку и масштабное обучение с подкреплением. Их цель — довести компьютеры до 4 эры: компьютер, который думает и действует за вас.

И вот здесь возникает интересный вопрос. Крупные корпорации пытаются натянуть языковые модели на задачи управления компьютером. А небольшая команда из MIT идёт с другого конца. Строит систему, заточенную под действия с самого начала. Получается, что старый подход, где большие языковые модели плюс дополнительная настройка может быть тупиком.

Если OpenAGI правы, то мы наблюдаем смену парадигмы прямо сейчас. Не улучшение существующих моделей, а фундаментально иной подход к созданию агентов.

Почитать из последнего
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.
Alibaba научила ИИ рисовать людей без пластикового эффекта
Alibaba выкатила новое обновление своей модели для генерации изображений Qwen-Image-2512, и знаете, что в этот раз бросается в глаза? Они наконец-то решили главную проблему всех нейросетевых картинок. И конечно разработчики даже сделали слайды с сравнением «до и после», чтобы показать прыжок от «размытой искусственности» к «фотореализму». Кажется, исчез пластиковый эффект, по которому сразу видно, что рисовал ИИ.