Post Thumbnail

Новый Grok 3 от xAI превзошёл GPT-4 и Claude 3.5

xAI, компания Илона Маска, представила революционную версию языковой модели Grok 3, которая установила новые стандарты производительности в области искусственного интеллекта, превзойдя ведущих конкурентов, включая OpenAI GPT-4, Claude 3.5, Deepseek V3 и Gemini 2 Pro.

Впервые в истории ИИ-модель преодолела барьер в 1400 баллов по шкале ELO в системе оценки LMArena, заняв первое место во всех категориях тестирования. Grok 3 продемонстрировал впечатляющие результаты в ключевых областях: 52% в стандартном режиме и 96% с включенным режимом рассуждений на тесте AIME 24, 75% (улучшается до 85%) в тесте GPQA, и от 57% до 80% в тестах на программирование LiveCodeBench.

Техническим фундаментом unprecedented производительности Grok 3 стал суперкомпьютер Colossus, оснащенный 100 000 графических процессоров NVIDIA H100. Вычислительная мощность новой версии в 10 раз превышает показатели предшественника Grok 2.

Модель получила ряд инновационных функций, включая режим “Big Brain” для повышенной производительности, улучшенные способности к рассуждению и скорое добавление голосового интерфейса. Пользователи смогут активировать расширенные возможности рассуждений для решения сложных задач в области математики, науки и программирования, используя команды “Think” и “Think harder”.

“Модель достигла пугающе высокого уровня интеллекта”, – прокомментировал Илон Маск, подчеркивая беспрецедентные творческие и эмергентные способности системы. Особо отмечается успех Grok 3 в создании креативного программного кода и генерации инновационных игр.

xAI планирует запустить веб-версию Grok 3 с множеством персонализированных ИИ-личностей для соответствия предпочтениям пользователей. Компания также анонсировала намерение сделать предыдущую версию, Grok 2, открытым исходным кодом в ближайшие месяцы.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Главный экономист МВФ сравнил бум ИИ с пузырём доткомов

Главный экономист МВФ Пьер-Оливье Гуринша заявил, что мир уже прошёл половину пути до лопнувшего пузыря искусственного интеллекта и нового финансового кризиса.

Исследователи взломали 12 систем защиты ИИ

Знаете, что только что выяснили исследователи из OpenAI, Anthropic, Google DeepMind и Гарварда? Они попытались сломать популярные системы безопасности искусственного интеллекта и почти везде нашли обход. Проверяли 12 распространённых подходов к защите. От умных формулировок системного промпта до внешних фильтров, которые должны ловить опасные запросы.

У OpenAI есть 5 лет чтобы превратить $13 млрд в триллион

Знаете, в каком положении сейчас находится OpenAI? По сообщению Financial Times, у компании есть 5 лет, чтобы превратить 13 млрд долларов в триллион. И вот как это выглядит на практике.

Сэм Альтман обещает вернуть человечность в ChatGPT

Глава OpenAI Сэм Альтман сделал заявление после того, как прошли многочисленные оффлайн и онлайн протесты против отключения модели GPT-4о. А потом включение, но с диким маршрутизатором. Я рассказывал про это на прошлой неделе максимально подробно. Прямая цитата главы OpenAI.

ИИ оживает: почему сооснователь Anthropic боится своего творения

Сооснователь Anthropic Джек Кларк опубликовал эссе, от которого становится не по себе. Он написал про природу современного искусственного интеллекта, и его выводы звучат как предупреждение.