Publicado: agosto 21, 2025, 4:23 am
Hasta no hace mucho, lograr convertir una imagen como la de la izquierda en algo como lo de la derecha no era del todo sencillo. Podías hacerlo, sí, pero para ello necesitabas conocimientos avanzados de programas de edición de imagen como Photoshop y, por supuesto, tiempo. Eso cada vez es menos cierto, y utilizar la IA generativa para transformar imágenes es ya un ejemplo claro de que esta tecnología puede hacer muy fácil lo que antes era muy difícil.
Hola, Qwen-Image-Editor. Así se llama el modelo de IA generativa publicado por Alibaba y que forma parte de su cada vez más reputada familia de modelos Qwen. Estamos ante un modelo específicamente entrenado para lograr editar fotos e imágenes de forma extremandamente sencilla: basta pedírselo con un prompt.
Usar esta IA es mucho más fácil que usar Photoshop de forma tradicional, y en muchos casos los resultados son excepcionales.
Tú mandas, la IA obedece creando. El nuevo Qwen-Image-Edit está disponible para probar directamente en el sitio web de este modelo. Al ir a esa página veremos como ya está precargado el modo «Edición de Imagen», y bastará subir una foto y luego usar algún prompt para modificarla con órdenes como «Girarla a la derecha», «añadir un pequeño letrero con el texto «Xataka», «cambiar la camisa negra por una verde» o «restaurar vieja fotografía, eliminar arañazos, reducir ruido, mejorar detalles, alta resolución, realista, tonos de piel». Las posibilidades son infinitas, pero además podremos ir trabajando sobre esa imagen de forma sucesiva.
Un modelo cada vez más capaz. Este modelo es una especie de ‘fork’ de Qwen-Image, el modelo fundacional de 20.000 millones de parámentros (20B) que Alibaba publicó a principios de mes. Dicho modelo se centraba en cosas como poder renderizar texto en las imágenes, pero aquí la edición va más allá. El modelo está disponible en Qwen Chat, pero también en Hugging Face, ModelScope, GitHub y a través de la API de Alibaba Cloud (el coste es de 0,045 dólares por imagen, pero las 100 primeras son gratis).
Fuente: Alibaba Cloud.
En la nube y en local, en tu PC. Aunque es muy cómodo usarlo desde la interfaz de Qwen Chat —que permite generar hasta 8 imágenes gratis (entrada/salida) imágenes gratis cada 12 horas—, también es posible descargarlo y usarlo en local en un PC o portátil con la suficiente memoria gráfica (el modelo pesa 54 GB).
El experto Simon Willinson lo ha hecho en su MacBook Pro M2 de 64 GB de memoria unificada y comprobó cómo con 10 pasos de inferencia (por defecto usa 50, pero eso lleva mucho más tiempo) tardó 25 minutos en generar una modificación de una imagen. En Qwen Chat, que aprovecha mucho más recursos de cómputo, apenas hay que esperar unos segundos por cada imagen.
Entendiendo la imagen antes de editarla. Una de las ventajas de Qwen-Image-Editor está en que hace uso del llamado mecanismo de doble codificación. Este sistema consiste en analizar las imágenes de entrada con el modelo de reconocimiento visual Qwen2.5-VL para «entender» la imagen y saber qué hay en ella y luego usar un autocodificador variable (VAE) para añadir los detalles de recosntrucción (la edición). Con este enfoque se consigue mantener la fidelidad al original modificando solo lo que el usuario pide.
Plato con pelos, plato sin pelos. La diferencia es sutil, pero muy relevante, sobre todo porque como veis el resto de la imagen queda absolutamente intacta.
Junyang Lin, uno de los investigadores implicados en el desarrollo de este modelo, explicaba que eso permite cómo «puede eliminar un pelo de un plato» dejando el reto de la imagen sin modificar, algo que según sus palabras «es una modificación de imagen muy delicada».
El prompt le indicaba al modelo que cambiase a azul solo el color de la letra «n». Así que el modelo analizar la imagen original, reconoce esa letra, y le cambia el color sin modificar el resto.
Edición semántica. Otra de las grandes características de este modelo es su capacidad de realizar una edición semántica de la imagen. Esto es: lo que cambia es la estructura o el significado de una imagen. Por ejemplo, podemos aplicar el famoso efecto de imagen con estilo de Studio Ghibli u otro que transforme una foto en una escena creada con Legos, pero preservando la identidad de los objetos o personas de la imagen original.
Transformar cualquier imagen en otra que parezca una escena de alguna película de LEGO es también muy sencillo con este modelo. Y de nuevo, el contenido original mantiene su esencia.
Transformando la realidad. Como otros modelos de IA generativa similares, la evolución sigue siendo notable. Ya vimos como el editor mágico de Google hace tiempo que planteaba esto mismo, pero Qwen-Image-Editor va un paso más allá al poder mantener esa fidelidad de la apariencia en la imagen original.
Por ejemplo, añadiendo graffitis en inglés o chino —idiomas que este modelo maneja a la perfección— mientras el resto de la imagen se mantiene idéntica a la original. La calidad y consistencia de los textos es extraordinaria. Incluso se adaptan a la ropa, incluso si tiene arrugas, para que el efecto de realismo sea mayor, como sucede (aunque no se nota tanto) con el jersey de la imagen de Mark Zuckerberg.
{«videoId»:»x8jpy2b»,»autoplay»:false,»title»:»¿Qué hay DETRÁS de IAs como CHATGPT, DALL-E o MIDJOURNEY? | INTELIGENCIA ARTIFICIAL», «tag»:»Webedia-prod», «duration»:»1173″}
Un ejemplo de una tendencia prodigiosa (e inquietante). Aquí estamos hablando solo de un modelo que edita imágenes y las transforma, algo que ya habíamos visto en el pasado pero que con Qwen-Image-Editor va aún más allá. La lección en realidad es más profunda: todos estos modelos logran hacernos vislumbrar un futuro en el que saber manejar complejas aplicaciones (como Photoshop y similares en este caso) ya no será (tan) necesario.
¿Aprender Linux? ¿Yo? Salvo en casos específicos, muchas de las cosas que hacíamos con estas aplicaciones se podrán hacer sin tener ninguna idea de postprocesado gráfico: bastará con «hablar» con una IA para pedirle lo que queremos. Y lo que es cierto para Photoshop lo será igualmente para un sinfín de herramientas y sistemas: de repente exprimir al máximo Excel o la consola de Linux —por poner algún ejemplo— ya no hará necesario que las estudiemos y usemos durante horas (aunque eso siempre ayude). Ya lo habrá hecho la IA por nosotros.
(function() {
window._JS_MODULES = window._JS_MODULES || {};
var headElement = document.getElementsByTagName(‘head’)[0];
if (_JS_MODULES.instagram) {
var instagramScript = document.createElement(‘script’);
instagramScript.src = ‘https://platform.instagram.com/en_US/embeds.js’;
instagramScript.async = true;
instagramScript.defer = true;
headElement.appendChild(instagramScript);
}
})();
–
La noticia
Si Photoshop te parece complicada, no te preocupes: a esta IA china solo le tienes que decir lo que quieres para obtenerlo
fue publicada originalmente en
Xataka
por
Javier Pastor
.