Post Thumbnail

Hugging Face бросает вызов DeepSeek: Проект Open-R1 раскрывает секреты китайского ИИ

Команда Hugging Face представила первые результаты проекта Open-R1, направленного на воспроизведение технологий китайского искусственного интеллекта DeepSeek-R1. За неделю исследователям удалось достичь значительного прогресса в понимании и репликации этой передовой системы.

Ключевым достижением стало успешное воспроизведение результатов тестирования на бенчмарке MATH-500. Исследователи подтвердили впечатляющие показатели различных версий модели: DeepSeek-R1-Distill-Qwen-32B достигла точности 95.0% по сравнению с заявленными 94.3%, а версия на базе Llama-70B показала результат 93.4% против официальных 94.5%.

В ходе исследования была обнаружена уникальная особенность DeepSeek-R1 – беспрецедентная длина генерируемых ответов. Анализ распределения в наборе данных OpenThoughts показал, что средняя длина ответа составляет около 6000 токенов, а в некоторых случаях превышает 20 000 токенов. “Учитывая, что средняя страница содержит примерно 500 слов, а один токен немного короче слова, многие ответы превышают объем в 10 страниц”, – отмечают исследователи.

Для обеспечения прозрачности исследований команда Hugging Face создала открытую таблицу лидеров Open-R1, где сообщество может следить за прогрессом в воспроизведении результатов. Особое внимание уделяется проблеме значительных требований к памяти GPU при обучении из-за необходимости генерации длинных последовательностей.

Проект Open-R1, запущенный всего неделю назад, объединил усилия различных команд и сообщества разработчиков. Основной целью остается воспроизведение конвейера обучения и синтетических данных DeepSeek-R1, что позволит лучше понять принципы работы этой передовой системы искусственного интеллекта.

Эта инициатива демонстрирует растущую тенденцию к открытости и сотрудничеству в сфере ИИ, где даже самые сложные технологические достижения становятся предметом коллективного изучения и воспроизведения мировым сообществом разработчиков.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Amazon превращает курьеров в киборгов с умными очками на ИИ

Amazon решил превратить своих курьеров в киборгов. Нет, серьёзно – компания анонсировала умные очки с искусственным интеллектом для доставщиков. Идея, по словам гиганта e-commerce, в том, чтобы освободить водителям руки. И избавить их от необходимости постоянно переключать взгляд между телефоном, посылкой и окружающим пространством.

OpenAI добавит камео персонажей в Sora

Компания OpenAI опубликовала дорожную карту развития Sora, и знаете что? Похоже, компания наконец-то осознала, что генерация видео – это не просто технологическая демонстрация. А инструмент, которым людям нужно реально пользоваться. Билл Пиблс, глава проекта, анонсировал целый набор обновлений, и некоторые из них действительно интересны.

Starcloud запускает спутник с ИИ в ноябре для дата-центра в космосе

Знаете, куда теперь переносят дата-центры для искусственного интеллекта? В космос. Стартап Starcloud, участник программы NVIDIA Inception, планирует запустить в ноябре спутник с искусственным интеллектом на орбиту Земли. И это только начало их амбициозного плана решить проблемы энергопотребления и охлаждения дата-центров на Земле.

ChatGPT Atlas уязвим к промпт-инъекциям и может помогать фишингу

Я рассказывал про то, что компания OpenAI выпустила браузер ChatGPT Atlas. И вот первые пользователи уже нашли целый букет проблем. Начнём с базовых вещей. В браузере нет встроенного блокировщика рекламы, режима чтения и функции перевода текста на странице. Чтобы пересказать статью или перевести её, нужно просить бота в чате.

Китай сломал литографическую установку ASML при попытке её скопировать

Вот вам история про то, как импортозамещение столкнулось с суровой реальностью. Китай попытался разобрать литографическую установку ASML категории DUV, чтобы изучить её устройство. Результат? Повредили систему и обратились к самой ASML с просьбой отремонтировать. Абсурд ситуации зашкаливает.