Post Thumbnail

Nuevo modelo de DeepSeek reconoce documentos barato y eficientemente

DeepSeek lanzó nuevo modelo para reconocimiento de documentos. ¿Y saben qué? No solo lee texto de páginas – entiende estructura. Y hace esto barato y eficientemente, lo que es raro en mundo de IA.

Esta maravilla se llama DeepSeek-OCR, y diferencia con sistemas clásicos de reconocimiento óptico de caracteres es fundamental. OCR regulares simplemente extraen texto. Pero este modelo inmediatamente restaura estructura de documento: encabezados, listas, tablas, leyendas de figuras. Da resultado en formato Markdown, que es conveniente para indexación y trabajo posterior de redes neuronales.

Característica principal – compresión de contexto óptico llamada. Modelo no vuelve a contar cada detalle de página, sino que exprime solo lo necesario: texto y estructura semántica. Esto reduce volumen de datos 20 veces. Y menos tokens – procesamiento más barato y rápido por cualquier modelo de lenguaje posterior.

DeepSeek-OCR usa tokens visuales. Estos son miradas condicionales a partes de imagen. Incluso con pequeño presupuesto de 100 tokens, precisión de reconocimiento se mantiene en 97%. Si página es demasiado compleja, se activa modo Gundam. Documento se divide automáticamente en fragmentos, y áreas difíciles se analizan por separado sin pérdida de velocidad.

En benchmarks sistema mostró resultados impresionantes. Y precisión prácticamente no cae incluso con número mínimo de tokens visuales, y tasa de compresión alcanza 20 veces. Eficiencia en forma pura.

Autor: AIvengo
Latest News
Científicos tienen más miedo de alucinaciones de IA

Cuanto más científicos trabajan con inteligencia artificial, menos confían en ella. Editor académico Wiley publicó informe preliminar para 2025 sobre impacto de tecnologías en ciencia, y conclusiones ahí son paradójicas. Investigadores comenzaron a tratar redes neuronales con mayor escepticismo que hace año, cuando tecnología era obviamente menos desarrollada.

Nuevo modelo de DeepSeek reconoce documentos barato y eficientemente

DeepSeek lanzó nuevo modelo para reconocimiento de documentos. ¿Y saben qué? No solo lee texto de páginas - entiende estructura. Y hace esto barato y eficientemente, lo que es raro en mundo de IA.

OpenAI desmintió oficialmente lanzamiento de GPT-6 antes de fin de año

En OpenAI decidieron enfriar expectativas públicas y confesaron: GPT-6 no sucederá este año. Pero no se apresuren a estar decepcionados - esto no significa que compañía esté inactiva.

Padre del aprendizaje por refuerzo predijo fin de era de grandes modelos de lenguaje

Richard Sutton - este es uno de padres del aprendizaje por refuerzo y laureado del premio Turing. Así que declaró que era de grandes modelos de lenguaje está llegando a su fin. Siguiente, en su opinión, viene era de experiencia. Y aquí está por qué piensa así.

Inteligencia artificial detecta TDAH sin cuestionarios ni médicos

Imaginen que pueden diagnosticar TDAH simplemente por cómo su cerebro procesa letras parpadeantes en pantalla. Sin cuestionarios, sin meses de espera para cita con especialista. IA mira sus ritmos visuales y da veredicto con 92% de precisión. ¿Suena como ciencia ficción? Pero esto ya es realidad.