Новая модель от DeepSeek распознаёт документы дёшево и эффективно
DeepSeek выкатили новую модель для распознавания документов. И знаете что? Она не просто читает текст со страниц — она понимает структуру. И делает это дёшево и эффективно, что редкость в мире искусственного интеллекта.
Называется это чудо DeepSeek-OCR, и отличие от классических систем оптического распознавания символов принципиальное. Обычные OCR просто извлекают текст. А эта модель сразу восстанавливает структуру документа: заголовки, списки, таблицы, подписи к рисункам. Результат выдаёт в формате Markdown, который удобен для индексации и последующей работы нейросетей.
Главная фишка — так называемое оптическое сжатие контекста. Модель не пересказывает каждую мелочь со страницы, а выжимает только нужное: текст и смысловую структуру. Это сокращает объём данных в 20 раз. А меньше токенов — дешевле и быстрее обработка любой последующей языковой моделью.
DeepSeek-OCR использует визуальные токены. Это условные взгляды на части изображения. Даже при небольшом бюджете в 100 токенов точность распознавания держится на уровне 97%. Если страница слишком сложная, включается режим Gundam. При этом документ автоматически делится на фрагменты, и трудные области анализируются отдельно без потери скорости.
В бенчмарках система показала впечатляющие результаты. И точность практически не падает даже при минимальном числе визуальных токенов, а степень сжатия достигает 20-кратного. Эффективность в чистом виде.
AIvengo >
Новости ИИ >
Новая модель от DeepSeek распознаёт документы дёшево и эффективно
Почитать из последнего
Более 30 000 врачей и юристов обучают нейросети делать их работу
Представьте картину: журналист с 20-летним стажем, которого выкинули в прошлом году, сидит и правит статьи, которые создал ИИ. 20-30 часов в неделю. За деньги. Чтобы машина научилась писать ещё лучше. Абсурд? Добро пожаловать в новую реальность белых воротничков.
Из-за ИИ теоретическая физика исчезнет через 10 лет
Физик-теоретик и популяризатор науки Сабина Хоссенфельдер, выдала интересный прогноз. Она считает, что через 3 года научные исследования в привычном виде перестанут существовать. А через 10 лет теоретическая физика как область человеческой деятельности может практически закончиться. Для решения задач будет достаточно просто купить вычислительное время нейросети. Звучит как антиутопия? Только вот процесс уже пошёл.
Nvidia и Siemens превратят завод в гигантского робота с ИИ
Глава Nvidia Дженсен Хуанг на выставке CES выдал очень интересную фразу, цитирую: "Эти производственные предприятия, по сути, станут гигантскими роботами". Так Nvidia и Siemens анонсировали создание Industrial AI Operating System. Платформы, которая внедрит ИИ во всю цепочку промышленного производства. От проектирования до логистики. Завод будущего не просто автоматизирован — он думает сам.
Крёстный отец SaaS уволил продажников и заменил их ИИ за полгода
Джейсон Лемкин, которого называют крёстным отцом SaaS и основателем сообщества SaaStr, публично заявил что больше не будет нанимать людей в отдел продаж своей компании. Вместо живых менеджеров теперь работают агенты на основе ИИ. По его словам, переход занял меньше года.
Создатель Signal запустил ИИ-ассистента с полной анонимностью
Создатель мессенджера Signal Мокси Марлинспайк, решил сделать с чат-ботами то же что сделал с мессенджерами. Добавить слой анонимности который не пробьёшь. Его новый проект Confer с открытым исходным кодом гарантирует что данные пользователей будут недоступны вообще никому. Ни оператору платформы, ни хакерам, ни правоохранителям, ни любой другой стороне кроме самих владельцев.