ChatGPT Images vs. Nano Banana Pro: los dos modelos de generación y edición de imágenes frente a frente
por Edgar Otero 1ChatGPT Images es la respuesta de OpenAI a Nano Banana Pro
La batalla está servida. Si hace apenas unas semanas Google nos sorprendía con el lanzamiento de Nano Banana Pro, ahora es OpenAI quien mueve ficha. Y no lo hace de cualquier manera. La compañía de Sam Altman acaba de desplegar su artillería pesada con ChatGPT Images, impulsado por el nuevo modelo GPT-Image-1.5. Este modelo llega a la par que GPT-5.2 y con un apartado dedicado dentro de la interfaz del chatbot.
En esta guía te voy a mostrar las diferencias reales entre estos dos titanes. Porque, seamos sinceros, sobre el papel ambos prometen ser revolucionarios con ediciones mágicas, textos perfectos y un realismo que asusta. Pero, ¿cuál se adapta mejor a tu flujo de trabajo? Antes de entrar en materia con los prompts y las pruebas de fuego, pongamos un poco de orden en los nombres técnicos, que esto empieza a parecer un trabalenguas:
- Nano Banana Pro. Es el nombre oficioso para Gemini 3 Pro Image. Destaca por su resolución 4K, sus "controles de estudio" y se activa desde el modo Razonamiento en Gemini.
- ChatGPT Images (GPT-Image-1.5). Es la actualización del modelo insignia de OpenAI. Apuesta por la velocidad (hasta 4 veces más rápido), una nueva interfaz visual en la barra lateral y una capacidad de edición quirúrgica.
La propuesta de OpenAI es clara. La idea es aportar inmediatez y facilidad de uso con una interfaz llena de filtros y preajustes. La de Google, por su parte, parece enfocarse más en la fuerza bruta de la resolución y en la comprensión multimodal para generar documentos complejos. Ahora bien, ¿cómo se traduce esto en el mundo real? Vamos a comprobarlo.
Fotografía hiperrealista
Empezamos por lo que muchos consideran uno de los puntos débiles de la IA generativa: el realismo fotográfico. Aquí es donde Nano Banana Pro sacó pecho con su gestión del grano y la iluminación, pero ChatGPT Images promete resultados más naturales y menos artificiales. Para ponerlos a prueba, he usado dos prompts que buscan el fallo en las texturas y la iluminación compleja.
Empezamos con un retrato con iluminación difícil:
- Un retrato en primer plano de una anciana en un mercado nocturno de Marrakech. La iluminación proviene de farolillos de colores y luces de neón desenfocadas en el fondo (bokeh cremoso). Se deben apreciar las arrugas de la piel, la textura de un pañuelo de lana áspera sobre su cabeza y el reflejo de las luces en sus ojos. Fotografía estilo documental, 50 mm, f/1.8.


Vamos ahora con una prueba de texturas y naturaleza macro.
- Fotografía macro de una abeja posada sobre una flor de lavanda cubierta de rocío matutino. Quiero ver los pelillos de las patas de la abeja con total nitidez y las microgotas de agua reflejando el entorno. Fondo verde suave y difuminado. Luz natural, fresca y nítida.


Lo que buscamos aquí no es solo que la imagen sea bonita, sino que el modelo entienda la física de la luz y no genere esa piel de porcelana falsa que tanto delata a las IA. Y parece que ambas se desenvuelven bien, aunque creo que Nano Banana Pro es capaz, por muy poco, de lograr un realismo que no parece artificial, especialmente en la imagen de la abeja.
Inserción de texto en imágenes
Este era el talón de Aquiles de la generación de imagen hasta hace nada (junto con el de dibujar manos realistas). Nano Banana Pro ya demostró que podía con ello, pero GPT-Image-1.5 asegura haber mejorado el renderizado de texto denso. Para esta sección, vamos a jugar con la edición sobre imágenes base.
Vamos a tratar de insertar un rótulo de neón en una foto nocturna de una calle lluviosa donde se vea un letrero de neón brillante de un restaurante o bar.
- Teniendo en cuenta la imagen de la calle que te adjunto, inserta un texto en forma de neón en uno de los edificios. Quiero que ponga "Cyber Bistro 2077" en el mismo color y estilo que el resto. Además, añade un subtítulo más pequeño debajo que diga "Abierto 24 h" en luz blanca. El reflejo en el suelo mojado debe coincidir con el nuevo texto.



En este caso, Nano Banana Pro vuelve a ganar. En una sola petición (nunca hago una segunda para mejorar el resultado), ofrece una edición más correcta, incluso reflejando el texto en el suelo de manera más o menos acertada.
Creación de infografías y documentos técnicos
Aquí es donde Nano Banana Pro me dejó alucinado con su capacidad de generar despieces técnicos. ¿Podrá ChatGPT, con su nuevo motor de renderizado, hacerle sombra? Vamos a pedirles que estructuren información visual compleja.
Empecemos con un documento sobre el ciclo de vida de una mariposa monarca. Este es un recurso que podría usarse en entornos educativos, por ejemplo.
- Crea una ilustración científica educativa sobre el ciclo de vida de una mariposa monarca. Debe ser un diseño circular. Fases: Huevo (sobre una hoja), Larva (oruga a rayas), Pupa (capullo verde) y Adulto (mariposa volando). Añade flechas curvas que conecten las fases y etiquetas de texto en español para cada etapa. Estilo de ilustración botánica clásica, acuarela suave.


En este punto, estamos probando la capacidad de razonamiento espacial y organización de la información, no solo la estética. La cuestión es que ambos modelos fallan a la hora de ordenar la información, a pesar de que el prompt la expone en la secuencia adecuada. Sin embargo, ambos insertan el texto correctamente y generan la imagen siguiendo el estilo adecuado. Posiblemente, en una segunda iteración se podría modificar el orden, pero recuerda que los resultados expuestos siempre son los obtenidos a partir de la primera petición.
Consistencia en las ediciones
Este es un dolor de cabeza habitual: generas un personaje genial, pero en la siguiente imagen ya tiene otra cara. Para este experimento, usaremos el retrato de una persona real y les pediremos que se la lleven de viaje.
Aquí el retrato original que he obtenido de Unsplash:

La secuencia de los pompts será esta. Primero, veremos al personaje en una reunión de negocios:
- Toma al hombre de la foto de referencia y sitúalo en una sala de reuniones moderna, vestido con un traje azul marino elegante. Está señalando una pizarra blanca con gráficos de ventas. Su expresión debe ser de confianza. Es vital que la cara, la barba y las gafas sean idénticas a las de la foto original.


Luego, lo enviaremos a una aventura en la montaña:
- Ahora quiero que uses al mismo personaje, pero en una situación totalmente distinta. Está escalando una montaña nevada. Lleva ropa térmica roja y un gorro de lana, pero se le debe reconocer perfectamente la cara, la barba y las gafas. La iluminación es de sol de alta montaña, muy brillante.


Finalmente, para probar la edición de estilos, le pediremos al modelo que convierta la imagen en una foto nostálgica:
- Aplica un filtro de recuerdo nostálgico a esta imagen. Quiero que parezca una foto sacada con una cámara desechable de 1998. Añade grano, colores ligeramente deslavados, un poco de fuga de luz naranja en una esquina y la fecha "15 07 98" impresa en digital rojo en la esquina inferior derecha.


La coherencia aquí lo es todo. Si parece su primo lejano, el modelo suspende. La cuestión es que ChatGPT Images ha sido el menos escrupuloso a la hora de editar la imagen original. La ha tomado y ha mantenido la coherencia de forma notable.
¿Qué ha pasado con Nano Banana Pro? Pues que se ha negado a hacer una imagen con un "personaje público" y, finalmente, ha optado por generar una cara totalmente genérica. A partir de ahí, ha mantenido la coherencia visual, aunque no con la calidad de ChatGPT Images. Sería interesante ver cómo se comporta sin esta limitación, pero esto no es posible, al menos en la versión comercial.
¿Cuáles son las conclusiones?
En términos generales, me han gustado más los resultados de Nano Banana Pro. Proporciona ediciones más acertadas en la primera iteración e imágenes con una calidad altísima. No obstante, es evidente que ChatGPT Images es una respuesta más que digna al modelo de Google. En realidad, opino que están bastante a la par. Por otro lado, en la última prueba, debido a las restricciones de Gemini 3, no ha sido posible utilizar la imagen original de muestra.
Solo me queda preguntarte directamente a ti qué opinas. ¡Te leo en los comentarios!
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!




