Post Thumbnail

Hugging Face бросает вызов DeepSeek: Проект Open-R1 раскрывает секреты китайского ИИ

Команда Hugging Face представила первые результаты проекта Open-R1, направленного на воспроизведение технологий китайского искусственного интеллекта DeepSeek-R1. За неделю исследователям удалось достичь значительного прогресса в понимании и репликации этой передовой системы.

Ключевым достижением стало успешное воспроизведение результатов тестирования на бенчмарке MATH-500. Исследователи подтвердили впечатляющие показатели различных версий модели: DeepSeek-R1-Distill-Qwen-32B достигла точности 95.0% по сравнению с заявленными 94.3%, а версия на базе Llama-70B показала результат 93.4% против официальных 94.5%.

В ходе исследования была обнаружена уникальная особенность DeepSeek-R1 – беспрецедентная длина генерируемых ответов. Анализ распределения в наборе данных OpenThoughts показал, что средняя длина ответа составляет около 6000 токенов, а в некоторых случаях превышает 20 000 токенов. «Учитывая, что средняя страница содержит примерно 500 слов, а один токен немного короче слова, многие ответы превышают объем в 10 страниц», – отмечают исследователи.

Для обеспечения прозрачности исследований команда Hugging Face создала открытую таблицу лидеров Open-R1, где сообщество может следить за прогрессом в воспроизведении результатов. Особое внимание уделяется проблеме значительных требований к памяти GPU при обучении из-за необходимости генерации длинных последовательностей.

Проект Open-R1, запущенный всего неделю назад, объединил усилия различных команд и сообщества разработчиков. Основной целью остается воспроизведение конвейера обучения и синтетических данных DeepSeek-R1, что позволит лучше понять принципы работы этой передовой системы искусственного интеллекта.

Эта инициатива демонстрирует растущую тенденцию к открытости и сотрудничеству в сфере ИИ, где даже самые сложные технологические достижения становятся предметом коллективного изучения и воспроизведения мировым сообществом разработчиков.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.

Latest News

Провал роботакси Tesla: 11 нарушений ПДД за первые дни из 20 машин

Мечта о роботакси сталкивается с суровой реальностью! Тесла запустила публичные испытания беспилотных такси в Остине, но результаты оказались далеки от обещанного технологического чуда. За первые дни тестирования зафиксировано минимум 11 серьезных нарушений правил дорожного движения. И это при том, что на дороги вышло всего 20 автомобилей, отобранных для ограниченного круга блогеров. Филип Купман, профессор Университета Карнеги-Меллон и эксперт по автономным технологиям, не скрывает удивления: "Это ужасно быстро для появления такого количества видео с нестабильным вождением".

Цукерберг переманил 3 топ-исследователей OpenAI за $100 млн

Эпическая битва за таланты продолжается. И Цукерберг переманивает элитных исследователей из OpenAI! Марк сделал настоящий стратегический ход и увёл из OpenAI 3 выдающихся специалистов: Лукаса Бейера, Александра Колесникова и Сяохуа Чжай.

Imagry создала беспилотник без HD-карт

Компания Imagry создала уникальную технологию беспилотного управления, которая работает без HD-карт. В основе этого инженерного чуда лежит биоинспирированный подход, имитирующий человеческое восприятие и принятие решений. Представьте себе — система видит дорогу глазами-камерами и принимает решения мозгом-нейросетью, в точности как опытный водитель!

Министерство США молча заменило доклад с фальшивыми цитатами ИИ

Доклад Министерства здравоохранения и социальных служб США о хронических детских заболеваниях оказался в центре научного скандала. Эксперты обнаружили, что в документе "Make Our Children Healthy Again Assessment" присутствуют фальсифицированные цитаты и несуществующие исследования.

ИИ Meta блокирует тысячи групп Facebook за "терроризм"

Раньше я рассказывал, что искусственный интеллект Meta массово блокирует аккаунты в Instagram. Теперь он блокирует и группы в Facebook. Идет беспрецедентная волна блокировок. Тысячи групп Facebook оказались под необоснованными санкциями системы модерации. Этот технический коллапс затронул сообщества как в США, так и за рубежом, охватив самые разнообразные тематические категории.