Durante las últimas semanas el generador de imágenes de IA de DALL-E 2 ha causado sensación en Twitter, por lo que Google ha hecho pública su propia versión, llamada “IMAGEN”, un nuevo sistema de IA que crea imágenes que combinan un profundo nivel de comprensión del lenguaje con un grado de foto realismo nunca antes visto.
“IMAGEN” parte de la capacidad de los modelos de lenguaje de grandes transformadores para la comprensión del texto así como de la fuerza de los modelos de difusión para la generación de imágenes de alta fidelidad.
Para probar este gran avance, Google creó un punto de referencia para evaluar los modelos de texto a imagen llamado DrawBench, que es una lista de aproximadamente 200 indicaciones de texto que el equipo de Google ingresó en “IMAGEN” y otros generadores de texto a imagen, con el resultado de cada programa luego juzgado por evaluadores humanos.
Los evaluadores humanos prefirieron “IMAGEN” sobre otros modelos en las comparaciones lado a lado, tanto en términos de calidad de la muestra como de alineación imagen-texto”. Se comparó con VQ-GAN+CLIP, los modelos de difusión latente y DALL-E 2.
“IMAGEN” El proyecto de Google que crea imágenes fotorrealistas a partir de texto pero con litaciones y un impacto social importante
The Package Design Book
The Package Design BookSi bien es un herramienta que a primera vista encontramos como alucinante y super necesaria sobre todo en esos momentos que la creatividad se bloquea y nos cuesta materializar las ideas en la gráfica, pero volviendo a la realidad y desde el punto de vista de arista y/o diseñador es un “arma de doble filo” ya que cada vez es mas fácil “reemplazar” el trabajo humano por una inteligencia artificial.
Pero por otro lado también encontramos las limitaciones y el impacto social, sin duda existen ya varios retos éticos a los que se enfrenta la investigación sobre conversión de texto en imagen en general.
Con “IMAGEN” (enlace) es posible crear cualquier imagen en alta calidad por más descabellada que parezca, en alta definición y de forma rápida; veamos algunos ejemplos: