Post Thumbnail

Новая модель от DeepSeek распознаёт документы дёшево и эффективно

DeepSeek выкатили новую модель для распознавания документов. И знаете что? Она не просто читает текст со страниц — она понимает структуру. И делает это дёшево и эффективно, что редкость в мире искусственного интеллекта.

Называется это чудо DeepSeek-OCR, и отличие от классических систем оптического распознавания символов принципиальное. Обычные OCR просто извлекают текст. А эта модель сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к рисункам. Результат выдаёт в формате Markdown, который удобен для индексации и последующей работы нейросетей.

Главная фишка — так называемое оптическое сжатие контекста. Модель не пересказывает каждую мелочь со страницы, а выжимает только нужное: текст и смысловую структуру. Это сокращает объём данных в 20 раз. А меньше токенов — дешевле и быстрее обработка любой последующей языковой моделью.

DeepSeek-OCR использует визуальные токены. Это условные взгляды на части изображения. Даже при небольшом бюджете в 100 токенов точность распознавания держится на уровне 97%. Если страница слишком сложная, включается режим Gundam. При этом документ автоматически делится на фрагменты, и трудные области анализируются отдельно без потери скорости.

В бенчмарках система показала впечатляющие результаты. И точность практически не падает даже при минимальном числе визуальных токенов, а степень сжатия достигает 20-кратного. Эффективность в чистом виде.

Автор: AIvengo
5 лет я работаю с машинным обучением и искусственным интеллектом. И эта сфера не перестает меня удивлять, восхищать и интересовать.
Latest News
Учёные стали больше бояться галлюцинаций ИИ

Чем больше учёные работают с искусственным интеллектом, тем меньше они ему доверяют. Академический издатель Wiley выпустил предварительный отчёт за 2025 год о влиянии технологий на науку, и выводы там парадоксальные. Исследователи стали относиться к нейросетям с большим скептицизмом, чем год назад, когда технология была явно менее развита.

Новая модель от DeepSeek распознаёт документы дёшево и эффективно

DeepSeek выкатили новую модель для распознавания документов. И знаете что? Она не просто читает текст со страниц — она понимает структуру. И делает это дёшево и эффективно, что редкость в мире искусственного интеллекта.

OpenAI официально опровергла выход GPT-6 до конца года

В OpenAI решили охладить ожидания публики и признались. GPT-6 в этом году не будет. Но не спешите расстраиваться — это не значит, что компания сидит сложа руки.

Отец обучения с подкреплением предрек конец эры больших языковых моделей

Ричард Саттон - это 1 из отцов обучения с подкреплением и лауреат премии Тьюринга. Так вот он заявил, что эпоха больших языковых моделей подходит к концу. Дальше, по его мнению, наступает эра опыта. И вот почему он так считает.

Искусственный интеллект выявляет СДВГ без опросников и врачей

Представьте, что можно диагностировать на СДВГ просто по тому, как ваш мозг обрабатывает мелькающие буквы на экране. Никаких опросников, никаких месяцев ожидания приёма у специалиста. Искусственный интеллект смотрит на ваши визуальные ритмы и выдаёт вердикт с точностью 92%. Звучит как фантастика? Но это уже реальность.