Aplicaciones Publicado el 28 de agosto de 2025

Google lanza Gemini 2.5 Flash Image: el editor de fotos con IA que supera a ChatGPT en precisión y realismo

Edición de imágenes con IA: Google apuesta por la precisión donde ChatGPT falla

El nuevo modelo Gemini 2.5 Flash Image permite modificar fotos mediante comandos de lenguaje natural, pero con un salto cualitativo: mantiene la coherencia de elementos complejos como rostros, animales o texturas, algo que herramientas como DALL·E 3 (de OpenAI) o Grok (de xAI) aún no logran con la misma fiabilidad. Según Google, el sistema evita distorsiones comunes al editar, por ejemplo, el color de una camiseta o el estilo de un mueble, sin alterar el resto de la imagen.

[EMBED:image:https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/gemini-2-5-image-editing-character-consistency.original.png] Ejemplos de Google

La herramienta ya estaba siendo probada de forma anónima en LMArena, una plataforma de evaluación colaborativa, donde destacó bajo el alias "nano-banana". Demis Hassabis, CEO de Google DeepMind, confirmó la autoría con un tuit críptico el pasado 25 de agosto, acompañando una imagen generada por el modelo. "Estamos avanzando tanto en la calidad visual como en la capacidad de seguir instrucciones", declaró Nicole Brichtova, líder de producto en modelos de generación visual de Google DeepMind, en entrevista con TechCrunch. El enfoque no es solo técnico: el modelo está optimizado para casos de uso cotidiano, como diseñar reformas del hogar, combinar referencias visuales (ej.: un sofá + una paleta de colores) o generar imágenes realistas en conversaciones de varios turnos.

[EMBED:image:https://chatimg.ai/_next/image?url=%2Fblog%2Fnano-banana-revolution%2Fsundar-pichai-context-aware-editing.jpg&w=3840&q=75] Poonam Soni - X

Guerra por los usuarios: Google vs. OpenAI en la batalla de los generadores visuales

La actualización llega en un momento crítico. ChatGPT supera los 700 millones de usuarios semanales, mientras que Gemini —según datos de su último informe de ganancias— ronda los 450 millones mensuales (sin desglosar cifras semanales). OpenAI disparó su adopción en marzo con el lanzamiento de GPT-4o y su generador de imágenes nativo, que viralizó memes al estilo Studio Ghibli y colapsó temporalmente sus servidores. Meta, por su parte, anunció la semana pasada un acuerdo para licenciar modelos de Midjourney, y la startup alemana Black Forest Labs (respaldada por a16z) sigue dominando benchmarks con su modelo FLUX.

[EMBED:image:https://storage.googleapis.com/gweb-developer-goog-blog-assets/images/gemini-image__image-editing__no_product-reconte.original.png] Imarena Leaderboard

Google no oculta su objetivo: recuperar terreno. "Queremos dar a los usuarios control creativo, pero con límites", aclaró Brichtova, en referencia a los polémicos errores pasados de Gemini, como la generación de imágenes históricamente inexactas que llevaron a la compañía a retirar temporalmente su herramienta en 2024. Ahora, el modelo incluye salvaguardas contra contenido no consensual (ej.: deepfakes íntimos), aunque su eficacia dependerá de la implementación: las imágenes llevan marcas de agua y metadatos, pero estos no son visibles al ojo humano en redes sociales. Mientras, competidores como Grok (de xAI) han sido criticados por permitir generaciones explícitas sin filtros, como las que afectaron a celebridades como Taylor Swift.

La apuesta de Google va más allá del consumo masivo. Gemini 2.5 Flash Image ya está disponible para desarrolladores a través de Gemini API, Google AI Studio y Vertex AI, lo que podría acelerar su adopción en aplicaciones de terceros. La pregunta ahora es si la precisión técnica —y el enfoque en casos prácticos— bastarán para frenar el dominio de OpenAI en un mercado donde la viralidad suele pesar más que los benchmarks.

El modelo está disponible hoy en versión preliminar a través de la [API Gemini](https://ai.google.dev/gemini-api/docs/image-generation?hl=es-419) y [Google AI Studio](https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-preview-image), pero será estable en las próximas semanas.