Post Thumbnail

DeepSeek R1 después de actualización menor se acercó al nivel OpenAI O3

La compañía DeepSeek lanzó actualización para su modelo de lenguaje R1. A pesar de que desarrolladores la llamaron “menor”, muchos usuarios notan mejoras sustanciales. Reportan que razonamiento del modelo se volvió notablemente más profundo y prolongado, acercándose al nivel de O3 de OpenAI – uno de los modelos más poderosos en el mercado.

¡Simplemente sin palabras! Incluso aparecieron capturas de pantalla en línea donde el modelo demuestra razonamiento continuo por más de 20 minutos. Bueno, esto es salto significativo en rendimiento. El anuncio de actualización fue hecho a través de cuenta oficial de compañía en red social china WeChat, y pueden probar nuevas capacidades ahora mismo en sitio web oficial deepseek.com.

Aún no hay pruebas oficiales de rendimiento que pudieran confirmar afirmaciones de usuarios sobre alcanzar nivel O3. Pero comunidad de expertos ya espera con ansias publicación de benchmarks para obtener evaluación de nueva actualización. Si rumores se confirman y DeepSeek R1 realmente logró rendimiento comparable a O3 de OpenAI, esto es realmente genial. Pienso que si R1 después de simple actualización se acercó a nivel O3, entonces futura versión DeepSeek R2 puede abrir era de sistemas verdaderamente “pensantes” capaces de mantener análisis profundo a nivel comparable con expertos humanos. Emocionante y alarmante.

Autor: AIvengo

Latest News

ChatGPT llama a los usuarios "semillas estelares" del planeta Lyra

Resulta que ChatGPT puede atraer a los usuarios al mundo de teorías científicamente infundadas y místicas.

La música IA desencadena emociones más fuertes que la música humana

¿Alguna vez se han preguntado por qué una melodía les da escalofríos mientras otra los deja indiferentes? Los científicos descubrieron algo interesante. La música creada por inteligencia artificial desencadena en las personas reacciones emocionales más intensas que las composiciones escritas por humanos.

GPT-5 fue hackeado en 24 horas

2 empresas de investigación independientes NeuralTrust y SPLX descubrieron vulnerabilidades críticas en el sistema de seguridad del nuevo modelo solo 24 horas después del lanzamiento de GPT-5. Para comparación, Grok-4 fue hackeado en 2 días, haciendo el caso de GPT-5 aún más alarmante.

Cloudflare bloqueó a Perplexity por 6 millones de solicitudes ocultas al día

Cloudflare asestó un golpe aplastante a Perplexity AI, bloqueando el acceso de la startup de búsqueda a miles de sitios. ¿La razón? ¡Escaneo oculto de recursos web de escala sin precedentes a pesar de prohibiciones explícitas de los propietarios!

Amenazas y $1 billón no mejoran el trabajo de las redes neuronales

Seguramente han visto estos "trucos secretos" para controlar redes neuronales. Como amenazas, promesas de recompensas, manipulaciones emocionales. ¿Pero realmente funcionan? Investigadores de la Universidad de Pennsylvania y Wharton School realizaron un experimento a gran escala con 5 modelos avanzados: Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini y GPT o4-mini.