Новый Grok 3 от xAI превзошёл GPT-4 и Claude 3.5

Post Thumbnail

xAI, компания Илона Маска, представила революционную версию языковой модели Grok 3, которая установила новые стандарты производительности в области искусственного интеллекта, превзойдя ведущих конкурентов, включая OpenAI GPT-4, Claude 3.5, Deepseek V3 и Gemini 2 Pro.

Впервые в истории ИИ-модель преодолела барьер в 1400 баллов по шкале ELO в системе оценки LMArena, заняв первое место во всех категориях тестирования. Grok 3 продемонстрировал впечатляющие результаты в ключевых областях: 52% в стандартном режиме и 96% с включенным режимом рассуждений на тесте AIME 24, 75% (улучшается до 85%) в тесте GPQA, и от 57% до 80% в тестах на программирование LiveCodeBench.

Техническим фундаментом unprecedented производительности Grok 3 стал суперкомпьютер Colossus, оснащенный 100 000 графических процессоров NVIDIA H100. Вычислительная мощность новой версии в 10 раз превышает показатели предшественника Grok 2.

Модель получила ряд инновационных функций, включая режим «Big Brain» для повышенной производительности, улучшенные способности к рассуждению и скорое добавление голосового интерфейса. Пользователи смогут активировать расширенные возможности рассуждений для решения сложных задач в области математики, науки и программирования, используя команды «Think» и «Think harder».

«Модель достигла пугающе высокого уровня интеллекта», – прокомментировал Илон Маск, подчеркивая беспрецедентные творческие и эмергентные способности системы. Особо отмечается успех Grok 3 в создании креативного программного кода и генерации инновационных игр.

xAI планирует запустить веб-версию Grok 3 с множеством персонализированных ИИ-личностей для соответствия предпочтениям пользователей. Компания также анонсировала намерение сделать предыдущую версию, Grok 2, открытым исходным кодом в ближайшие месяцы.

Почитать из последнего
Alibaba научила алгоритм видеть рак там, где врачи пропускают
Каменщик 57 лет в Китае пришёл в больницу проверить диабет. Обычный осмотр, ничего особенного. Через 3 дня ему звонит заведующий отделением поджелудочной железы, мол приезжайте срочно. ИИ, который прогнал его КТ-снимок, нашёл опухоль. Оказалось – рак, но на ранней стадии. Вырезали и мужчина выжил. Без этой технологии его бы нашли слишком поздно, когда 5-летняя выживаемость около 10%.
OpenAI к 2028 году увеличит мощности дата-центров в 90 раз
Epoch AI сделал публично доступным трекер крупнейших дата-центров. А человек из твиттера с ником Peter Gostev визуализировал суммарные мощности по месяцам в разрезе компаний, и цифры просто убийственные.
Робот с лазером собрал 20 млн долларов, чтобы выжигать сорняки ярче солнца
Carbon Robotics привлекла 20 миллионов долларов на разработку третьей линейки продуктов. Компания делает роботов, которые выжигают сорняки лазером и работают в 14 странах. А за всем этим стоит большая растительная модель, которую разрабатывали с первых дней.
Шведский подросток бросил школу и теперь работает научным сотрудником в OpenAI
Габриэлю Петерссону 23 года, он бросил школу в глухом шведском городке и никогда не учился в университете. Но прямо сейчас он работает научным сотрудником в OpenAI в команде Sora. И Габриэль рассказал, как у него так получилось.
Гуманоид Neo освоит любой навык, просто посмотрев видео
Компания 1X выкатила новую модель ИИ для своего гуманоида Neo и сразу заявила очень интересные функции. Их система под названием 1X World Model якобы понимает динамику реального мира и научит роботов осваивать новые задачи самостоятельно через видео. Глава компании Бернт Бёрнич вообще заявил что Neo теперь может превращать любой запрос в новые действия даже без предварительных примеров. Звучит как магия правда?