Grok 4.1 от Илона Маска галлюцинирует в 3 раза реже предыдущей версии

Post Thumbnail

Вышел Grok 4.1 от Илона Маска это не просто очередное обновление. Модель прокачали в эмоциональном интеллекте и существенно уменьшили количество галлюцинаций. И она стала намного более эмпатичной и чуткой.

Показывают даже лучшие результаты на EQ-Bench. Это бенчмарк с задачками на всякие soft skills. Правда, с новой версией 5.1 сравнения нет.

Но главный результат, пожалуй, в другом. Модель галлюцинирует в 3 раза реже, чем предыдущая версия. Вот это действительно здорово. Потому что эмпатия эмпатией, а точность — это то, что определяет, можно ли доверять модели в реальных задачах.

По данным компании, Grok 4.1 значительно улучшает качество взаимодействия за счёт расширенных творческих, эмоциональных и совместных возможностей. Модель стала лучше воспринимать тонкие намерения пользователя, придерживается более целостного стиля общения и сохраняет «личность», при этом не теряя точности.

Для достижения результатов xAI применила масштабную инфраструктуру обучения с подкреплением, ранее использовавшуюся для Grok 4. И оптимизировала стиль, характер и полезность новой версии. Компания также разработала методы, позволяющие использовать передовые агентные модели рассуждений в качестве моделей вознаграждения.

В бенчмарке на написание творческих текстов новая модель уступила только версии GPT-5.1.

Получается, Grok научили чувствовать настроение и писать красиво. Но самое важное — модель стала в 3 раза меньше галлюцинировать.

Почитать из последнего
Forbes подсчитал, кто заработал миллиарды на буме нейросетей
В 25-м году ИИ превратил больше предпринимателей в миллиардеров. А инвесторы вложили в сектор ИИ свыше 200 миллиардов долларов. Это почти 50% всего мирового венчурного финансирования. Forbes подвёл итоги: крупнейшие состояния сколотили не только создатели моделей, но и те, кто строит инфраструктуру вокруг них.
В Китае текстильная фабрика работает полностью на ИИ и без людей
В китайском городе Синьцзянь заработала текстильная фабрика, которая работает полностью с помощью ИИ. И вот вам картина будущего, в котором людям на производстве места нет. На огромном производстве ни одного рабочего на линии. Около 5000 ткацких станков крутятся круглосуточно под управлением ИИ и робототехники.
Психиатры зафиксировали десятки случаев, когда люди сходят с ума от ChatGPT
The Wall Street Journal пишет, что рост популярности чат-ботов на ИИ вызывает обеспокоенность психиатров, фиксирующих отдельные случаи расстройств на этой почве.
Similarweb показал, за счёт чего Gemini отжирает долю у OpenAI
Similarweb опубликовал свежую аналитику по доле разных продуктов на больших языковых моделях в веб-трафике. И вот вам картина перераспределения рынка. В начале года у ChatGPT было 87%, теперь — 68%. Доля упала почти на 20%.
Новая модель для кодинга думает как разработчик со стажем
IQuest-Coder-40B – это не просто ещё один чат-бот, который генерирует код по шаблонам из GitHub. Это новая open-source модель для кодинга с 40 миллиардами параметров. Которая обучалась совсем не так, как его конкуренты.