Post Thumbnail

DeepSeek lanzó 2 modelos con un avance en sistemas agénticos e IA

La startup china DeepSeek lanzó 2 modelos que pretenden ser un avance en sistemas agénticos. Y a juzgar por las métricas, esto no es solo marketing.

DeepSeek-V3.2 — este es el sucesor oficial de la versión experimental. Disponible en la aplicación, en el sitio web y a través de API. DeepSeek-V3.2-Speciale — una versión mejorada con énfasis en razonamiento avanzado de múltiples pasos. Por ahora funciona solo a través de API.

Ambos modelos enfatizan cadenas de razonamiento profundas y comportamiento para escenarios agénticos. Esto es planificación, resolución de problemas, inferencias complejas y trabajo con datos estructurados.

DeepSeek-V3.2-Speciale se convirtió en el primer modelo de código abierto que gana oro en olimpiadas de alto nivel. ¡Oro en 4 olimpiadas prestigiosas! Según las métricas, Speciale supera a Gemini 3.0 Pro en matemáticas, y el menos potente DeepSeek-V3.2 supera a Claude-4.5 Sonnet en codificación.

Pero hay un matiz. El test-time compute es enorme. Speciale no ahorra tokens en absoluto, por lo que la inferencia resulta costosa. Los propios autores admiten que “dejaron la optimización para investigaciones futuras”.

Razones técnicas del éxito: esta es la nueva arquitectura DeepSeek Sparse Attention, entrenamiento RL estable a gran escala y un gran pipeline para tareas agénticas. Y este es el cambio clave de arquitectura en comparación con la generación anterior.

Ambos modelos son extremadamente buenos en todo tipo de tareas agénticas, y especialmente en búsqueda y tareas con navegador. Para esto se generaron 1800 entornos sintéticos en los que los agentes se entrenaron para realizar tareas completamente diferentes.

Salió un modelo muy genial, respeto.

Autor: AIvengo
Latest News
OpenAGI lanzó el modelo Lux que supera a Google y OpenAI

La startup OpenAGI lanzó el modelo Lux para control de computadora y afirma que esto es un avance. Según los benchmarks, el modelo supera por una generación completa a los análogos de Google, OpenAI y Anthropic. Además, funciona más rápido. Aproximadamente 1 segundo por paso en lugar de 3 segundos en los competidores. Y 10 veces más barato en costo por procesamiento de 1 token.

Altman declaró alerta roja en OpenAI debido a los éxitos de Google

Sam Altman declaró "nivel de alerta roja" en OpenAI, y esto no es solo drama corporativo. Esta es una admisión de que el líder del mercado sintió el aliento de los competidores en la espalda. Según un memorándum interno, está movilizando recursos adicionales para mejorar ChatGPT ante la creciente amenaza de Google.

Los usuarios pasan más tiempo con Gemini que con ChatGPT

OpenAI todavía lidera en número de usuarios, pero la gente está comenzando a pasar más tiempo con competidores. Y esto crea un problema serio.

Las empresas están trayendo de vuelta al 5% de los despedidos debido al fracaso de la implementación de IA

Muchas empresas comenzaron a traer de vuelta a empleados despedidos por causa de la inteligencia artificial. La compañía de análisis Visier estudió datos de empleo de 2,5 millones de empleados de 142 empresas en todo el mundo. Aproximadamente el 5% de los empleados despedidos posteriormente regresaron a su empleador anterior. Este indicador se mantuvo estable durante varios años, pero recientemente comenzó a aumentar.

DeepSeek lanzó 2 modelos con un avance en sistemas agénticos e IA

La startup china DeepSeek lanzó 2 modelos que pretenden ser un avance en sistemas agénticos. Y a juzgar por las métricas, esto no es solo marketing.