Post Thumbnail

4 модели ИИ спорят между собой и выбирают лучший ответ

Бывший директор по искусственному интеллекту в Tesla Андрей Карпаты, выложил на GitHub свой «проект выходного дня». Приложение llm-council. Это «совет ИИ», где несколько языковых моделей параллельно готовят ответы и выбирают лучший.

В конфигурации Карпаты работают GPT 5 и 1, Gemini 3 Pro, Claude Sonnet 4 и 5 и Grok 4. Подключение через единый шлюз OpenRouter и можно выбрать другие модели. Сам Андрей говорит, что собрал это, чтобы читать книги вместе с несколькими моделями и наблюдать, как они спорят между собой.

Процесс устроен в 3 шага. Сначала каждая модель независимо отвечает на запрос, и пользователь сравнивает варианты. Затем модели получают анонимные ответы друг друга без указания авторства. И должны оценить и ранжировать их по качеству. На 3-м шаге в игру вступает «председатель» совета, отдельная модель. Карпаты выбрал Gemini 3 Pro: она видит всё и собирает финальный, «коллективно выверенный» ответ.

Интересно, что совет почти всегда ставит GPT 5 и 1 на первое место как самую «глубокую и полезную» модель. Claude стабильно оказывается внизу, Gemini 3 Pro и Grok 4 где-то посередине. Но сам Карпаты не согласен с этим «голосованием»: ответы GPT 5 и 1 он считает слишком многословными, Gemini 3 Pro более собранной, а Claude — чрезмерно лаконичным.

Получается парадокс. Модели искусственного интеллекта выбирают лучшего среди себя, но человек с ними не согласен.

Автор: aivengo_ai
Latest News
Gemini может стать мозгом для всех роботов на планете

Google сделала неожиданный ход. Компания наняла бывшего технического директора Boston Dynamics Аарона Сандерса вице-президентом по аппаратному обеспечению. И это не просто кадровое назначение.

Искусственный интеллект диагностирует болезни сердца через смарт-часы

Системы ИИ могут довольно точно выявлять серьёзные аномалии в здоровье сердечно-сосудистой системы даже по примитивным данным с Apple Watch.

Китайский робот с искусственным интеллектом замаскировался под медузу

Китайские учёные разработали почти неотличимого от медузы робота под названием «водный призрак». Благодаря скромному потреблению небольшое устройство способно длительно находиться в воде. И следить как за экосистемой океана, так и за подводной инфраструктурой, делая это максимально скрытно.

4 модели ИИ спорят между собой и выбирают лучший ответ

Бывший директор по искусственному интеллекту в Tesla Андрей Карпаты, выложил на GitHub свой «проект выходного дня». Приложение llm-council. Это «совет ИИ», где несколько языковых моделей параллельно готовят ответы и выбирают лучший.

Студент оказался умнее ИИ стоимостью миллиарды долларов

Мечта об учёном с искусственным интеллектом разбилась о реальность. Gemini 3 Pro и GPT-5 и 1 провалили задачи, с которыми справляется обычный аспирант.