Post Thumbnail

Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam

У нас очередной технологический прорыв из Китая! Проект Kimi.ai представляет исследовательского агента Kimi Researcher. Который превосходит флагманские решения технологических гигантов.

Kimi Researcher демонстрирует поистине впечатляющие результаты! Агент уверенно лидирует во всех ключевых бенчмарках. Включая престижный Humanity’s Last Exam. Соревнование, которое считается золотым стандартом для оценки исследовательских возможностей искусственного интеллекта.

Техническая реализация поражает продуманностью. При выполнении 1 исследовательской задачи система выполняет в среднем 23 шага рассуждения и параллельно анализирует более 200 уникальных URL. Это беспрецедентный уровень глубины анализа, который обеспечивает максимальную точность и полноту результатов.

Отдельного внимания заслуживает тонкая настройка использования инструментов с применением улучшенных методов многоагентного диалога. Речь идет про протокол MCP. Это позволяет агенту эффективно комбинировать различные исследовательские стратегии и адаптироваться к сложным информационным потокам.

Базовым фундаментом агента стала собственная языковая модель k1.5. Которую команда Kimi подвергла end-to-end дообучению с применением методов обучения с подкреплением.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Революция в строительстве: робот FBR в 15 раз быстрее каменщиков

6 тыс. лет люди клали кирпичи 1 и тем же способом. Но этой эпохе пришёл конец! Робот Hadrian X от компании FBR стал 1 в мире мобильным роботизированным устройством для кладки блоков, способным безопасно работать на открытом воздухе в неконтролируемых условиях.

Стартап Base 44 продан за $80 млн через 6 месяцев после создания

Израильский разработчик Маор Шломо продал свой стартап Base 44 компании Wix за 80 млн долларов наличными. Но самое интересно не сумма. Стартап за эту сумму был продан всего через 6 месяцев после его основания.

2 ИИ-аватара Baidu продали товаров на $7.5 млн за 6-часовой стрим

Китайский технологический гигант Baidu продемонстрировал будущее онлайн-торговли, и оно потрясает воображение! Впервые в истории 2 цифровых аватара, работающих на базе передовой модели искусственного интеллекта ERNIE, совместно провели полноценный коммерческий стрим.

Цукерберг переманил CEO Safe Superintelligence после отказа Суцкевера

Марк Цукерберг развернул масштабную кампанию по привлечению ключевых специалистов в искусственном интеллекте. И для этого использует разные методы.

Google создал Gemini Computer — первую генеративную операционную систему

Google представил концепт, который переворачивает наше представление об операционных системах. Встречайте Gemini Computer – 1 полностью генеративная операционная система. Где буквально всё создаётся в режиме реального времени! Google, похоже, стали первопроходцами в реализации концепции, о которой теоретизировал бывший сотрудник OpenAI Андрей Карпатый.