Gemini 2.5 Flash Image supera a GPT en 6 de 7 benchmarks

Gemini 2.5 Flash Image acaba de salir pero ya está aplastando competidores en generación de imágenes. Superando a GPT Image en 6 de 7 benchmarks. ¡10 días de pruebas bajo nombre código nano banana — y aquí está el resultado más genial!

Imaginen la escala de dominancia. 1er lugar en rendimiento general, personajes, creatividad, infografías, objetos y ambientes, recontextualización de productos. Solo en estilización el modelo perdió ante GPT Image y Qwen Image Edit.

Las capacidades son muy geniales. Tomen una imagen con pila de libros — el modelo los rota, los coloca en una cómoda, preserva fuentes y corrige posicionamiento relativo. ¿Combinar 4 imágenes en 1? ¡Fácil! ¡Esto es un cóctel poderoso de Photoshop, Figma y MidJourney en una interfaz!

La funcionalidad es muy diversa. Reemplazo de objetos sin artefactos, restauración de fotos antiguas, colorización profesional, remoción perfecta de fondo, cambios de iluminación. ¡Todo a través de un prompt intuitivo! ¡Simplemente describan el resultado deseado con palabras!

Característica revolucionaria — ¡el modelo puede razonar! No genera sin pensar sino que se guía por lógica del mundo, extrayendo conocimiento de Gemini 2.5 Flash. ¡Puede independientemente entender contexto y tomar la decisión correcta de visualización!

Todo este placer cuesta $39 por 1,000 imágenes.

¡Consistencia de personajes al más alto nivel! El modelo mantiene identidad y carácter a través de múltiples generaciones. Transferencia de estilo funciona excelentemente. ¡Pueden usar texto e imágenes simultáneamente como entrada!

Google no solo alcanzó a competidores. Crearon herramienta universal que combina generación, edición y comprensión lógica de contexto.