Post Thumbnail

DeepSeek R1 superó a Qwen 3 y redujo brecha con Gemini 2.5 Pro

Llegaron datos sobre DeepSeek R1, que recibió actualización seria. Y resultados son impresionantes. El modelo ahora supera confiadamente a su competidor Qwen 3 con 235 mil millones de parámetros. Aunque todavía se retrasa de buques insignia como Gemini 2.5 Pro y O3, la brecha se redujo significativamente. La mejora principal está relacionada con aumento de profundidad de razonamiento – ahora modelo usa promedio de 23,000 tokens para resolver tareas, mientras versión previa estaba limitada a 12,000. Esta capacidad para análisis más profundo trajo resultados impresionantes. Por ejemplo, en prueba AIME, precisión creció de 70% a 87.5%. Además de éxitos impresionantes en benchmarks, nueva versión comenzó a alucinar mucho menos y mejoró significativamente sus capacidades en desarrollo frontend. Aunque todavía tiene que crecer al nivel de Claude en esta esfera.

Creo que dentro del próximo año veremos nueva ola de integración de grandes modelos de lenguaje en sistemas de destilación de conocimiento. Donde modelos gigantes actuarán como «maestros» para versiones compactas. Esto llevará a avance rápido en eficiencia de modelos pequeños y su implementación en dispositivos móviles.

Autor: AIvengo

Latest News

NVIDIA no podía vender chips de IA hasta que apareció OpenAI

Jefe de NVIDIA Jensen Huang compartió historia interesante que hoy parece momento fatídico en desarrollo de tecnologías modernas.

Pudu Robotics lanzó CC1 Pro — robot limpia 8000 m² por ciclo

Compañía Pudu Robotics presentó nueva generación de sistemas de limpieza autónomos — CC1 Pro. Que eleva estándares de limpieza en grandes objetos comerciales a nivel fundamentalmente nuevo.

Boston Dynamics lanzó Orbit 5.0 — IA redujo inspecciones en 70%

Salió actualización genial Orbit 5.0 para plataforma de control de robots Spot de Boston Dynamics. ¡Que cambia fundamentalmente enfoque hacia analítica industrial y monitoreo! Sistema ahora permite control centralizado de flotas enteras de robots en múltiples instalaciones, proporcionando a operadores analítica detallada en tiempo real.

Abu Dhabi gastará $2.5 mil millones en ciudad gestionada por IA para 2027

Imaginen ciudad donde inteligencia artificial cuida cada aspecto de su vida. ¡Esto no es ciencia ficción, sino futuro cercano de Abu Dhabi! Compañías BOLD Technologies y My Aion están desarrollando plataforma unificada Aion Sentia. Que tomará control de todos sistemas urbanos — desde transporte hasta salud y educación.

4 ingenieros chinos contrabanderon 80 TB de datos de IA en mochilas a Malasia

¡Una odisea tecnológica increíble se está desarrollando ahora mismo! Ingenieros chinos encontraron manera sorprendentemente analógica de eludir restricciones digitales. Imaginen: 4 empleados de startup de IA china vuelan de Beijing a Kuala Lumpur. ¡Y cada uno lleva 15 discos duros en su mochila! En total — 80 terabytes de datos para entrenamiento de redes neuronales.