Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam
У нас очередной технологический прорыв из Китая! Проект Kimi.ai представляет исследовательского агента Kimi Researcher. Который превосходит флагманские решения технологических гигантов.
Kimi Researcher демонстрирует поистине впечатляющие результаты! Агент уверенно лидирует во всех ключевых бенчмарках. Включая престижный Humanity’s Last Exam. Соревнование, которое считается золотым стандартом для оценки исследовательских возможностей искусственного интеллекта.
Техническая реализация поражает продуманностью. При выполнении 1 исследовательской задачи система выполняет в среднем 23 шага рассуждения и параллельно анализирует более 200 уникальных URL. Это беспрецедентный уровень глубины анализа, который обеспечивает максимальную точность и полноту результатов.
Отдельного внимания заслуживает тонкая настройка использования инструментов с применением улучшенных методов многоагентного диалога. Речь идет про протокол MCP. Это позволяет агенту эффективно комбинировать различные исследовательские стратегии и адаптироваться к сложным информационным потокам.
Базовым фундаментом агента стала собственная языковая модель k1.5. Которую команда Kimi подвергла end-to-end дообучению с применением методов обучения с подкреплением.
AIvengo >
Новости ИИ >
Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam
Почитать из последнего
Запущена "фабрика по кастомизации роботьих душ"
Знаете, какой минус в современных роботах? Они все одинаковые. 1 и тот же механический голос, 1 и те же заученные фразы, никакой индивидуальности. Компания AgiBot решила, что с этим пора кончать. И запустила платформу LinkSoul, которую сами разработчики называют "фабрикой по кастомизации роботьих душ".
ИИ научился видеть стресс на рентгене
Знаете, что самое паршивое в хроническом стресе? Его не видно. Ты можешь годами жечь себя на работе, улыбаться всем и делать вид, что всё под контролем. А внутри организм тихо разваливается.
Google дал 3 года на появление AGI
Сооснователь и главный AGI-сайентист Google DeepMind Шейн Легг выдал заявление, от которого у многих поплыли глаза. По его оценке, вероятность появления AGI к 28 году составляет 50%. Правда, он сразу оговаривается: речь не о "божественном сверхразуме", а о "минимальном AGI. Агенте, способном выполнять когнитивные задачи, типичные для человека.
Проверили, как нейросети заменяют людей - и результат печальный
Scale AI и Center for AI Safety опубликовали результаты бенчмарка Remote Labor Index, который оценивает способность нейросетей выполнять реальную работу фрилансеров. И знаете что? Даже лучшие модели справились с заданиями на человеческом уровне лишь в 2,5% случаев.