Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam
У нас очередной технологический прорыв из Китая! Проект Kimi.ai представляет исследовательского агента Kimi Researcher. Который превосходит флагманские решения технологических гигантов.
Kimi Researcher демонстрирует поистине впечатляющие результаты! Агент уверенно лидирует во всех ключевых бенчмарках. Включая престижный Humanity’s Last Exam. Соревнование, которое считается золотым стандартом для оценки исследовательских возможностей искусственного интеллекта.
Техническая реализация поражает продуманностью. При выполнении 1 исследовательской задачи система выполняет в среднем 23 шага рассуждения и параллельно анализирует более 200 уникальных URL. Это беспрецедентный уровень глубины анализа, который обеспечивает максимальную точность и полноту результатов.
Отдельного внимания заслуживает тонкая настройка использования инструментов с применением улучшенных методов многоагентного диалога. Речь идет про протокол MCP. Это позволяет агенту эффективно комбинировать различные исследовательские стратегии и адаптироваться к сложным информационным потокам.
Базовым фундаментом агента стала собственная языковая модель k1.5. Которую команда Kimi подвергла end-to-end дообучению с применением методов обучения с подкреплением.
AIvengo >
Новости ИИ >
Китайский Kimi Researcher превзошел гигантов в Humanity’s Last Exam
Почитать из последнего
Создатели ИИ стали его первыми жертвами
OpenAI планирует значительно замедлить темпы роста и сократить набор новых сотрудников. По данным Business Insider, гендиректор Сэм Альтман заявил, что ИИ изменил темпы роста штата компании. Ирония ситуации в том, что создатели технологии, которая должна заменять людей, сами стали её первыми жертвами.
Oracle потеряла 463 миллиарда из-за паники вокруг ИИ
Акции Oracle рухнули более чем на 50 процентов по сравнению с прошлогодним историческим максимумом. Падение привело к снижению рыночной стоимости примерно на 463 миллиарда долларов по сравнению с рекордом, достигнутым 10 сентября. Когда компания представила впечатляющие перспективы облачного бизнеса и растущий спрос на ИИ. Тогда стоимость превысила 933 миллиарда долларов, что сделало её десятой по стоимости публичной компанией в США.
Магазины в США вытаскивают память и видеокарты из витринных ПК из-за воров
Американские магазины начали изымать модули оперативной памяти и видеокарты из витринных образцов игровых компьютеров из-за участившихся краж. Например, розничная сеть Costco столкнулась с проблемой настолько массово, что теперь показывает ПК вообще без внутренностей. Просто корпуса с работающей RGB-подсветкой и вентиляторами.
Airtable потеряла две трети стоимости и запустила ИИ, который её убьёт
Представьте: ваша компания рухнула с 11 миллиардов до 4, инвесторы в шоке, опционы сотрудников превратились в тыкву. Что делать? Логично было бы затаиться и латать дыры. Но основатель Airtable Хоуи Лю, делает ровно наоборот. Запускает совершенно новый продукт, который может похоронить его основной бизнес.
Гуманоид с бровями будет приносить вам зубные щётки в отеле
Американский стартап Fauna представил человекоподобного робота Sprout, и это не очередная железяка для склада. Его задача — быть компаньоном в гостиницах, ресторанах и магазинах. Принести стакан воды, подать зубную щётку, сопроводить до номера. Цена — 50 тысяч долларов, но Disney и Boston Dynamics уже среди первых покупателей.