Post Thumbnail

Новый Grok 3 от xAI превзошёл GPT-4 и Claude 3.5

xAI, компания Илона Маска, представила революционную версию языковой модели Grok 3, которая установила новые стандарты производительности в области искусственного интеллекта, превзойдя ведущих конкурентов, включая OpenAI GPT-4, Claude 3.5, Deepseek V3 и Gemini 2 Pro.

Впервые в истории ИИ-модель преодолела барьер в 1400 баллов по шкале ELO в системе оценки LMArena, заняв первое место во всех категориях тестирования. Grok 3 продемонстрировал впечатляющие результаты в ключевых областях: 52% в стандартном режиме и 96% с включенным режимом рассуждений на тесте AIME 24, 75% (улучшается до 85%) в тесте GPQA, и от 57% до 80% в тестах на программирование LiveCodeBench.

Техническим фундаментом unprecedented производительности Grok 3 стал суперкомпьютер Colossus, оснащенный 100 000 графических процессоров NVIDIA H100. Вычислительная мощность новой версии в 10 раз превышает показатели предшественника Grok 2.

Модель получила ряд инновационных функций, включая режим «Big Brain» для повышенной производительности, улучшенные способности к рассуждению и скорое добавление голосового интерфейса. Пользователи смогут активировать расширенные возможности рассуждений для решения сложных задач в области математики, науки и программирования, используя команды «Think» и «Think harder».

«Модель достигла пугающе высокого уровня интеллекта», – прокомментировал Илон Маск, подчеркивая беспрецедентные творческие и эмергентные способности системы. Особо отмечается успех Grok 3 в создании креативного программного кода и генерации инновационных игр.

xAI планирует запустить веб-версию Grok 3 с множеством персонализированных ИИ-личностей для соответствия предпочтениям пользователей. Компания также анонсировала намерение сделать предыдущую версию, Grok 2, открытым исходным кодом в ближайшие месяцы.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Открытая модель RoboBrain 2.0 станет основой для гуманоидных роботов

Модель искусственного интеллекта RoboBrain 2.0 теперь может объединять восприятие окружения и управлять роботами в 1 компактной системе. Специалисты уже называют её основой для будущего поколения гуманоидных роботов.

Tinder запустил двойные свидания: ИИ подбирает команды из 4 человек

Приложение Tinder запустило функцию двойных свиданий, которая позволяет пользователям объединяться с друзьями для поиска пар. Теперь можно пригласить до 3 друзей и вместе просматривать профили других так называемых команд. У которых есть хотя бы 1 совпадение в индивидуальных предпочтениях.

Новый бенчмарк показал провал ИИ в олимпиадных задачах по программированию

Появился новый бенчмарк LiveCodeBench Pro для оценки способностей искусственного интеллекта в программировании. Ссылка в описании. Он включает самые сложные и свежие задачи с популярных соревнований. Международной олимпиады по информатике и чемпионата мира по программированию. Задачи размечали сами победители и призёры этих соревнований.

Данные до 2022 года стали "доядерной сталью" для обучения ИИ

Искусственный интеллект, призванный стать локомотивом технологического прогресса, начинает тормозить собственное развитие. По данным издания The Register, генеративные модели заполнили интернет таким количеством синтетического контента, что это создаёт настоящий технологический тупик.

Сэм Альтман раскрыл попытки Meta переманить сотрудников за $100 млн

Сэм Альтман публично раскрыл беспрецедентную охоту за талантами, которую ведёт Марк Цукерберг. Глава Meta предлагает сотрудникам OpenAI поистине астрономические суммы. 100 млн долларов только в качестве входного бонуса!