Post Thumbnail

Grok 4 набрал 57% в “Последнем экзамене” против 22% у Gemini 2.5 Pro

Илон Маск представил новую версию своей нейросети – Grok 4. Максимальная версия – Grok 4 Heavy – способна запускать несколько вычислений одновременно и набирает 57% в сложнейшем тесте “Последний экзамен человечества”. Для сравнения, предыдущий лидер Gemini 2.5 Pro показывал только 22%.

Модель стала лучше понимать видео и изображения. Улучшился голосовой режим. Теперь Grok может не только говорить, но и шептать, петь, менять интонации и эмоции. В медицинском бенчмарке X-ray Grok 4 показывает 72.8%. Это выше всех остальных моделей.

По независимой оценке экспертов Artificial Analysis, Grok 4 сейчас действительно умнейшая модель, опережающая даже o3-pro от OpenAI.

Модель уже умеет собирать 3D игры: сама находит ассеты, подбирает текстуры и добавляет 3D модели в движок. Контекстное окно в API составляет 256 тыс. токенов.

В вендинговом бенчмарке Grok 4 заработал $4694 и продал больше 4 тыс. товаров. Для сравнения, новый Claude Opus смог заработать только $2077.

Максимальная версия Grok 4 Heavy будет доступна только по подписке за $300 в месяц. Базовый план за $30 включает обычный Grok 4, а бесплатные пользователи пока работают с Grok 3.

В августе ожидается выпуск отдельной кодовой модели, в сентябре появится мультимодальный агент. А в октябре выйдет версия для генерации видео. Все эти компоненты станут частью экосистемы Grok 4.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
CodeClash показал огромный разрыв между ИИ и человеческим программистом

Представлен CodeClash. Это новый бенчмарк для оценки навыков программирования у больших языковых моделей. И он показал: разрыв с человеческим уровнем огромен.

Майкл Бэрри поставил 1,1 млрд долларов против Nvidia и Palantir

Майкл Бэрри - это легендарный инвестор, который предсказал ипотечный кризис 2008 года. И вот он снова делает громкий ход. Майкл поставил 1,1 млрд долларов в пут-опционах против 2 крупных компаний из сектора искусственного интеллекта. Это Nvidia и Palantir.

XPeng представила первого в мире робота-гуманоида женщину

Китайский производитель электромобилей XPeng представил робота-гуманоида нового поколения IRON. И это 1 женщина гуманоид!

Anthropic проводит интервью с моделями перед отправкой на пенсию

Anthropic опубликовала политику "вывода из строя" устаревших версий искусственного интеллекта. Ключевое обязательство - это сохранять веса всех публичных и активно используемых внутри моделей минимум на срок жизни компании. Чтобы в будущем можно было вернуть доступ при необходимости.

Глава Nvidia считает, что ИИ-пузыря - нет

Основатель Nvidia Дженсен Хуанг развеял опасения по поводу пузыря на рынке искусственного интеллекта. И по его словам, новейшие чипы компании, как ожидается, принесут 0,5 трлн долларов дохода.