Post Thumbnail

Google Gemini 2.5 Pro superó OpenAI o3 y lidera en LMArena

Google actualizó Gemini 2.5 Pro con fuertes ganancias en benchmarks. Ahora modelo supera versión actual o3 de OpenAI. Como 2.5 Flash, este es modelo híbrido que permite establecer presupuesto para procesos de pensamiento o apagarlos completamente. Modelo ya está disponible y según primeras impresiones funciona mejor que versiones tempranas. Incluso escucha cuando le pides que no spam código con comentarios.

En arena LMArena, nueva versión subió 24 puntos Elo comparada con anterior y ahora lidera en todas categorías, superando o3 y Claude Opus 4. En benchmarks, modelo mejoró notablemente y se volvió más eficiente en tareas de código, lógica y ciencias exactas.

Resultados son impresionantes. 82.2% en tareas de programación, 86.4% en preguntas de ciencias naturales y 21.6% en test Humanity’s Last Exam, que verifica pensamiento y conocimiento.

Desarrolladores también tomaron en cuenta retroalimentación sobre versión previa y mejoraron estilo y estructura. Ahora modelo puede ser más creativo. También agregaron presupuestos para procesos de pensamiento para mayor control de costos. Desafortunadamente, generación de imágenes para Gemini Pro todavía no fue agregada.

Autor: AIvengo

Latest News

Samsung busca reemplazo para Google Gemini para Galaxy S26

Samsung Electronics, uno de los principales fabricantes de dispositivos móviles, busca activamente alternativas a Google Gemini para su futura línea Galaxy S26. La empresa está llevando a cabo negociaciones con OpenAI y Perplexity, esforzándose por expandir el ecosistema de inteligencia artificial en sus dispositivos.

Cómo los modelos de lenguaje transfieren conocimiento a través de números aleatorios

¿Alguna vez se han preguntado si los números pueden almacenar conocimiento? Los científicos descubrieron un fenómeno asombroso. Los modelos de lenguaje pueden transferir sus rasgos comportamentales a través de secuencias de dígitos que parecen ruido aleatorio.

Alibaba presentó gafas inteligentes Quark AI con chip Snapdragon AR1

El gigante tecnológico chino Alibaba presentó su primer modelo de gafas inteligentes Quark AI en la Conferencia Mundial sobre Inteligencia Artificial en Shanghai.

Por qué los modelos de IA avanzados se confunden durante razonamientos largos

Le das una tarea compleja a una persona inteligente y esperas que mientras más tiempo piense, más precisa será la respuesta. Lógico, ¿verdad? Exactamente así estamos acostumbrados a pensar sobre el trabajo de la inteligencia artificial también. Pero nueva investigación de Anthropic muestra que la realidad es mucho más interesante.

Z.AI presentó GLM-4.5 con 355 mil millones de parámetros y código abierto

¡Conozcan al nuevo peso pesado tecnológico! La empresa Z.AI presentó el modelo de lenguaje abierto GLM-4.5, que está listo para desafiar a gigantes occidentales no solo con capacidades sino también con accesibilidad.