imagen de la hermana de mi perrita dibujada

Generación de Imágenes con IA: El Avance Tecnológico en el Campo de la Inteligencia Artificial

2023-01-19
fathooo
Tecnología, Inteligencia Artificial, Programación


Generando imágenes a partir de texto con IA

Recientemente, he descubierto una fascinante tecnología de inteligencia artificial (IA) que me ha permitido generar imágenes realistas a partir de texto. Esta increíble herramienta utiliza un algoritmo llamado Stable Diffusion y ha sido desarrollada por OpenAI, una reconocida empresa en el campo de la IA.

¿Qué es Stable Diffusion?

Stable Diffusion es una tecnología de generación de imágenes que utiliza IA y está basada en el modelo DALL-E. A diferencia de otras soluciones similares, Stable Diffusion es de código abierto, lo que significa que es accesible para todos los desarrolladores interesados en utilizarla y modificarla según sus necesidades.

Cómo generar imágenes a partir de texto

El proceso de generación de imágenes a partir de texto es realmente fascinante. Para comenzar, es importante contar con un hardware adecuado, ya que el proceso puede ser lento sin la capacidad de procesamiento necesaria. Si no dispones de un hardware potente, puedes utilizar herramientas en la nube como Google Colab para aprovechar la potencia de cálculo que ofrecen.

A continuación, te mostrare un ejemplo de cómo generé imágenes utilizando esta tecnología:

Paso 1: Preparación del dataset

Para generar imágenes de mi perrita llamada Manchita, recopilé un conjunto de fotos de ella en diferentes poses. Sin embargo, los resultados no fueron satisfactorios, ya que las imágenes generadas no eran muy realistas.

Puedes ver las imagenes, las de arriba son las reales, las de abajo son las generadas. Imagenes de mi perrita manchita

Luego, decidí probar con el dataset de la hermana de Manchita, llamada Yeye. Esta vez, los resultados fueron mucho mejores.

Las siguientes son imagenes reales de la YEYE: Imagenes de la yeye

Paso 2: Generación de imágenes a partir del texto

Usando el modelo Stable Diffusion, introduje diferentes textos o "prompts" para generar imágenes de Yeye. A continuación, se muestran los prompts y las imágenes generadas:

"Photo of my_yeye, digital painting" Imagenes generadas de la yeye

"Photo of my_yeye" Imagenes generadas de la yeye

"my_yeye with flowers" - "my_yeye is blue with hat" -"my_yeye with hat" Imagenes generadas de la yeye

"my_yeye is a tatto" Imagenes generadas de la yeye

"my_yeye is brown" - "my_yeye is green" - "my_yeye is blue" - "my_yeye is white" Imagenes generadas de la yeye

"my_yeye in the pool" Imagenes generadas de la yeye

"A portrait of an anthropomorphic cyberpunk greyhound my_yeye eating a donut, cyberpunk!, fantasy, elegant, digital painting, artstation, concept art, matte, sharp focus, illustration, art by josan gonzalez" Imagenes generadas de la yeye

Estas imágenes muestran el increíble poder de la IA para generar contenido visual a partir de texto.

Conclusiones

La tecnología de generación de imágenes a partir de texto utilizando IA ha avanzado significativamente en los últimos años. Gracias a herramientas como Stable Diffusion, es posible crear imágenes realistas y de alta calidad con solo unos pocos comandos de texto. Esto tiene un gran potencial para diversas aplicaciones, como la generación de contenido dinámico para sitios web, imágenes de productos, retratos digitales y mucho más.

Si te interesa conocer más sobre esta tecnología y cómo implementarla en tus proyectos, recomiendo explorar las referencias que adjunto a continuación.

Referencias:

  • Este archivo te permite realizar la generación de imágenes a partir de texto, de un dataset de imagenes que tú agregues, todo está detallado. DreamBooth_Stable_Diffusion.ipynb
  • OpenAI (2022). DALL-E
  • REVISTA BBVA (2022). Link