Post Thumbnail

DeepSeek R1 superó a Qwen 3 y redujo brecha con Gemini 2.5 Pro

Llegaron datos sobre DeepSeek R1, que recibió actualización seria. Y resultados son impresionantes. El modelo ahora supera confiadamente a su competidor Qwen 3 con 235 mil millones de parámetros. Aunque todavía se retrasa de buques insignia como Gemini 2.5 Pro y O3, la brecha se redujo significativamente. La mejora principal está relacionada con aumento de profundidad de razonamiento – ahora modelo usa promedio de 23,000 tokens para resolver tareas, mientras versión previa estaba limitada a 12,000. Esta capacidad para análisis más profundo trajo resultados impresionantes. Por ejemplo, en prueba AIME, precisión creció de 70% a 87.5%. Además de éxitos impresionantes en benchmarks, nueva versión comenzó a alucinar mucho menos y mejoró significativamente sus capacidades en desarrollo frontend. Aunque todavía tiene que crecer al nivel de Claude en esta esfera.

Creo que dentro del próximo año veremos nueva ola de integración de grandes modelos de lenguaje en sistemas de destilación de conocimiento. Donde modelos gigantes actuarán como “maestros” para versiones compactas. Esto llevará a avance rápido en eficiencia de modelos pequeños y su implementación en dispositivos móviles.

Autor: AIvengo

Latest News

Solo 1 programador en el mundo pudo vencer a la IA de OpenAI

Imaginen un mundo donde la inteligencia artificial compite con los mejores programadores del planeta. Tal confrontación tuvo lugar en el prestigioso torneo AtCoder World Tour Finals. Esta es una de las competencias de programación más elitistas del mundo, donde es extremadamente difícil entrar.

Ex ingeniero de OpenAI contó sobre el caos dentro de la empresa

¿Quieren saber qué está pasando realmente dentro de OpenAI? El ex ingeniero Calvin French-Owen reveló todos los detalles después de que se fue de ahí hace 3 semanas.

Salario hasta $170k: Lo que SpaceX ofrece a desarrolladores de IA

SpaceX está haciendo un giro inesperado en su estrategia tecnológica. La empresa de Elon Musk abrió vacantes para ingenieros de software en el área de inteligencia artificial. Formando un equipo que se encargará de resolver las tareas más complejas de procesamiento de datos para cohetes portadores y naves espaciales.

Musk con $248 mil millones no compra PCs de trabajo pero espía empleados

¡La empresa xAI comenzó a monitorear a sus empleados directamente en sus computadoras personales! Los empleados que entrenan la inteligencia artificial Grok desde sus dispositivos fueron obligados a instalar programas de seguimiento.

Kimi-K2 con 1 billón de parámetros superó a GPT-4.1 en programación

¡La empresa tecnológica china Moonshot AI presentó un nuevo jugador en la arena de IA! Conozcan a Kimi-K2. Este es un gran modelo de lenguaje con código fuente abierto, listo para desafiar a líderes industriales reconocidos como Claude Sonnet 4 y GPT-4.1. Y tal inicio ruidoso y poderoso recuerda la aparición de Deepseek.