Post Thumbnail

Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam

У нас очередной технологический прорыв из Китая! Проект Kimi.ai представляет исследовательского агента Kimi Researcher. Который превосходит флагманские решения технологических гигантов.

Kimi Researcher демонстрирует поистине впечатляющие результаты! Агент уверенно лидирует во всех ключевых бенчмарках. Включая престижный Humanity’s Last Exam. Соревнование, которое считается золотым стандартом для оценки исследовательских возможностей искусственного интеллекта.

Техническая реализация поражает продуманностью. При выполнении 1 исследовательской задачи система выполняет в среднем 23 шага рассуждения и параллельно анализирует более 200 уникальных URL. Это беспрецедентный уровень глубины анализа, который обеспечивает максимальную точность и полноту результатов.

Отдельного внимания заслуживает тонкая настройка использования инструментов с применением улучшенных методов многоагентного диалога. Речь идет про протокол MCP. Это позволяет агенту эффективно комбинировать различные исследовательские стратегии и адаптироваться к сложным информационным потокам.

Базовым фундаментом агента стала собственная языковая модель k1.5. Которую команда Kimi подвергла end-to-end дообучению с применением методов обучения с подкреплением.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Как xAI конкурирует с OpenAI в инструментах для разработчиков

xAI запускает Grok Code Fast 1. Это компактная агентная модель для кодинга. $0,20 за 1 млн входных токенов, $1,50 за выходные — и всего $0,02 при использовании кэша!

Битва за браузеры: Anthropic против Perplexity и OpenAI

Похоже, Anthropic хочет трансформировать концепцию браузерных технологий. Claude для Chrome выходит в закрытое тестирование для 1 тыс. подписчиков Max-плана.

Китайский автономный трактор без руля и кабины работает в полях

Китайская компания Shiyan Guoke Honghu Technology представила полностью автономный трактор Honghu T70. Который самостоятельно передвигается по полям и выполняет весь спектр сельскохозяйственных задач без какого-либо участия человека.

Nvidia представила Jetson AGX Thor: 2560 ядер для роботов

Компания Nvidia презентовала разработку для физического искусственного интеллекта Jetson AGX Thor. Это не просто чип, это буквально мозг для роботов будущего. Представьте — 2560 ядер Blackwell и 128 ГБ оперативной памяти в 1 компактном устройстве!

GPT-5 оптимизирует затраты

Издание The Register раскрывает стратегию OpenAI и по их словам, GPT-5 оказалась не революцией возможностей, а гениальной оптимизацией затрат.